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"Nouveau variant gpl60 non-ciivable, soluble, de forme hy bride" 



10 



15 La presente invention concerne une methode pour construire des mo yens necessaires 

a la production de nouvelles molecules capables d'induire une reponse immuno-protectrice 
a l'encontre d'un virus responsable du syndrome d'immunodeficience acquise (SIDA). 

Chez un individu, cette maladie se developpe a la suite d'une infection des 
20 lymphocytes T-helper par un retrovirus HIV (human immunodeficiency virus). Jusqu'a 
present on a repertorie ces retrovirus en deux grand types: le type HIV-1 qui sevit 
essentiellement en Europe et en Amerique du Nord et le type HIV-2 caracteristique des 
infections africaines. A I'interieur d'un meme type, les retrovirus HIV presentent entre eux 
un cerain degre de variability qui se caracterise par exemple par une difference de 
25 trophisme cellulaire ou par des prolines virales legerement differentes les unes des autres. 
C'est pourquoi, lorsqu'on souhaite se referer a un retrovirus HIV particulier, on emploie 
de pr^terence le terme de "souche virale". 

D'une maniere generate, les retrovirus HIV ont la structure suivante : la molecule 
30 d'ARN genomique et diverses proteines associees sont encapsules dans une capside de 
nature proteique (nucleocapside). L'ensemble est protegfi par une membrane d'origine 
cellulaire ayant incorporfi la proline d'enveloppe d'origine virale. 

Cette proteine d'enveloppe, sous des formes diverses, est a ce jour considere comme 
35 un element therapeutique potentiel d'un vaccin contre le Sida. 

Dans les conditions naturelles, la proteine d'enveloppe (env) est initialement 
synthetisee sous forme d'un precurseur comportant a son extremity N-terminale une 
sequence signal qui initie le passage du precurseur dans le reticulum endoplasmique (voie 
40 de secretion). Ce peptide signal est ensuite elimine par clivage proteolytique. Le produit 



WO 92/19742 



PCT/FR92/00394 



-2- 

de ce clivage est une proteine appelee gpl60 qui est elle-meme par la suite clivee en une 
petite sous-unite gp40 et une grande sous-unite gpl20. L'extremite N-terminale de la 
gpl20 correspond a Pextremite N-terminale de la gpl60 tandis que l'extremite C-terminale 
de la gp40 correspond a l'extremite C-terminale de la gpl60. 

5 

Chacune des sous-unites est secretee a l'exterieur de la cellule infectee. Toutefois, 
la gp40 reste ancree dans la membrane cellulaire par son domaine transmembranaire. Sa 
partie C-terminale (domaine intra-cytoplasmique) reste en contact avec le cytoplasme 
tandis que sa partie N-terminale (domaine extra-cytoplasmique) se trouve a la surface de 
10 la cellule. La sous-unite gpl20 est relarguee a I'extdrieur de la cellule ou elle interagit 
avec le domaine extracellulaire de la sous-unite gp40. Les deux sous-unites de la proteine 
d'enveloppe restent ainsi associees sous forme de complexe. 

La sequence en acides amines des precurseurs des proteines env de diverses souches 
15 virales sont maintenant connues. A litre d'exemple, la Figure 1 presente la sequence des 
precurseurs des gpl60 des souches virales fflV-1 Bru, HTV-1 MN, HIV-1 EU HIV-1 RF, 
HIV-1 SF2C et HIV-1 SC. De meme, la Figure 2 presente la sequence du precurseur de 
la gpl60 de la soiiche virale HIV-2 Rod. 

20 Par la suite et pour faciliter la comprehension, les sequences des gpl60 autres que 

la gpl60 de la souche HIV-1 Bru seront ci-apres decrites par reference a la sequence de 
la gpl60 de la souche HTV-1 Bru (ci-apres appelee gpl60-Bru) comme suit : 

La gpl60-Bru possede 831 acides amines, ceux-ci numerates de 1 a 831. En outre 
la gpl20-Bru correspond a la sequence des 486 premiers acides amines de la gpl60- 
Bru tandis que la gp40-Bru correspond a la sequence commengant avec I'acide 
amine en position 487 et finissant avec I'acide amine en position 831. 

b) La sequence d'une gpI60 quelconque est alignee avec la sequence de la gpl60-Bru 
30 de maniere a presenter un maximum d'homologie. A cette fin, des emplacements 

vacants peuvent etre introduits soit dans la sequence de la gpl60-Bru, soit dans la 
sequence de la gpI60 quelconque. Par definition, la position d'un acide amine dans 
la gpl60 quelconque sera specifiee a Tidentique par la position de Tacide amine 
homologue dans la gpl60-Bru. 

35 

c) En consequence, lorsqu'un emplacement vacant est introduit dans la sequence de la 
gpl60 quelconque, en face de I'acide amine en position x, il n'existe pas d'acide 
amine en position x dans la sequence de la gpl60. Cependant, on considere que cet 
acide amine jouit d'une presence virtuelle. 
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d) Lorsqu'un ou plusieurs emplacement(s) vacant(s) est (sont) introduit(s) dans la 
sequence de la gpl60-Bru entre Pacide amine en position x et Pacide amine en 
position x + 1, on considere que, dans la gpl60 quelconque, la position recouvre au 
moins deux sous-positions x a , ^ , x n , chacune occupee par un acide amine. Par 

5 definition, la position d'aval x n represente la position x. 

e) Lorsqu'un ou plusieurs emplacements) vacant(s) est (sont) introduit(s) dans la 
sequence de la gpl60-Bru en amont de Pacide amine en position 1, on considere 
que, dans la gpl60 quelconque, la position 1 recouvre au moins deux sous-positions 

10 l a , l b , , 1 0 , chacune occupee par un acide amine. Par definition, la position 

d 'amont NH 2 -terminale l n represente la position 1. 

f) Lorsqu'un ou plusieurs emplacement(s) vacant(s) est (sont) introduit(s) dans la 
sequence de la gpl60 quelconque en face du ou des acide(s) amine(s) NH r 

15 terminal(aux) de la gpl60-Bru, on indique que, par definition, Pacide amine en 

position NH 2 -terminale dans la gpl60 quelconque cumule la position 1 et sa position 
d' acide amine homologue. 

g) Lorsqu'un ou plusieurs emplacements) vacant(s) est (sont) introduit(s) dans la 
20 sequence de la gpl60 quelconque en face du ou des acide(s) amine(s) COOH- 

terminal(aux) de la gpl60-Bru, on indique que, par definition, Pacide amine en 
position COOH-terminale dans la gpl60 quelconque cumule la position 841 et sa 
position d 'acide amine homologue. 

25 A ce jour, dans Poptique d'un vaccin, la proteine d'enveloppe est consideree comme 

un candidat potentiellement interessant d'un point de vue therapeutique. Toutefois, sa 
structure multichame d'origine constitue un handicap en terme de faisabilite. C'est 
pourquoi, il est apparu preferable d'utiliser une proteine simple chame qui conserverait 
la plupart des fipitopes de la gpl20 et ceux de la gp40. Ce type de proteine a deja ete 

30 propose dans la demande de brevet WO 87/6260. II s'agit plus particulierement d'un 
variant gpl60 non-clivable et soluble. 

Toutes les gpl60 des souches virales de type HIV-1 possedent, en positions 483 - 
486, un site de clivage dit majeur, reconnu par une ou des enzymes proteolytiques. Ce site 
35 de clivage est le meme pour toutes les gpl60 decrites a la Figure 1 et correspond a la 
sequence Arg-Glu-Lys-Arg (REKR). Les enzymes proteolytiques coupent immediatement 
en aval de ce site de clivage pour liberer une gpi20 et une gp40. 

Lorsque ce site de clivage n'existe pas, on a demontre que les enzymes 
40 proteolytiques reconnaissent avec une efficacite toutefois moindre un site de clivage dit 
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raineur et d'effectuer une coupure immediatement en aval de celui-ci. La aussi, ce site de 
clivage est le meme pour toutes les gpl60 montrees a la Figure 1. II correspond a la 
sequence Lys-Arg-Arg (KRR) en positions 477 - 479, selon certains auteurs ou selon 
d'autres, a la sequence Lys-Ala-Lys-Arg (KAKR) en positions 475 - 478. 

5 

En outre, on indique que les gpl60 des souches virales de type HIV-2 possedent 
uniquement un site de clivage majeur en positions 475 - 478 qui correspond a la sequence 
Lys-Glu-Arg-Lys (KEKR). 

10 Un variant gpl60 non-clivable est un analogue artificiel d'une gpl60 native. Sa 

sequence en acides amines correspond a celle d'une gpl60 native dans laquelle le site de 
clivage majeur et/ou le site de clivage mineur a (ont) ete supprim6(s). 

Une tel variant gpl60 peut etre synthetise grace aux techniques de l'ADN 
15 recombinant. II suffit d'isoler un fragment d'ADN codant pour une gpl60 native puis de 
modifier la region codant pour le site de clivage majeur par mutagenese dirigee, de 
maniere a obtenir un fragment d'ADN codant pour un variant gpl60 insensible a une 
action prot&iytique. Par la suite ce dernier fragment d'ADN est exprime dans des 
conditions appropriees pour donner ledit variant gpl60. Un tel variant gpl60 qui ne 
20 contient plus le site de clivage majeur est appelee ci-apres un variant gpl60 non-clivable 
de type A. 

De maniere preferee, la region codant pour le site de clivage mineur peut etre en 
outre modifiee a des fins identiques. Dans ces conditions, on obtient un variant gpl60 
25 non-clivable de type A' qui ne contient ni de site le clivage majeur, ni le site de clivage 
mineur. 

A cette fin, on indique a titre d'exempie que le site de clivage REKR, KEKR ou 
KAKR et le site de clivage KRR peuvent etre respectivement remplaces par les sequences 
30 Asn-Glu-His-Gin (NEHQ) et Gln-Asn-His (QNH). 

D'autre part, il est aussi necessaire qu'une gpl60 soit obtenue sous forme soluble. 
Une telle gpl60 correspond a une gpl60 native dans laquelle la region transmembranaire 
de nature hydrophobe a ete supprimee. Cette region transmembranaire est situee dans la 
35 zone correspondant a la gp40, du residu acide amine en position 659 au residu acide 
amine en position 680 De maniere additionnelle mais superflue, une autre region 
hydrophobe, allant du residu acide amine en position 487 au residu acide amine en 
position 514 pourrait etre deletee. 



40 De fagon similaire, les moyens necessaires a la synthese d'un variant gpl60 soluble 
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incluent bien evidemment le fragment d'ADN correspondant qui doit etre obtenu par 
modification du fragment d'ADN original. 

La comparison des sequences des differentes gpl60 deja connues a mis en evidence 
5 au moins trois domaines dont la sequence est hypervariable d'une gpl60 a l'autre. Ces 
trois domaines sont couramment appeles les domaines (ou boucles) V lt V 2 et V 3 . 

Les deux premiers domaines V x et V 2 sont situes entre le residu cysteine en position 
96 et le r6sidu cysteine en position 171 tandis que le troisieme domaine V 3 est situe du 
10 residu cysteine en position 271 au residu cysteine en position 306. 

II existe aussi un dernier domaine presentant un certain degre de variability toutefois 
considere comme moindre. II s'agit du site de fixation au recepteur CD4 des lymphocytes 
T-helper; celui-ci etant situe approximativement du residu acide amin6 en position 340 au 
IS residu acide amine en position 440. 

Quelque soit la gpl60 consideree, des experiences de vaccination ont montre que 
le troisieme domaine hypervariable est essentiel pour obtenir une immunite convenable. 
Toutefois, en raison de la nature hypervariable de ce domaine, la protection developpee 
20 ne serait efficace qu'a l'encontre de la souche virale dont est issue la gpl60 utilisee. 

Enfin il semblerait que le premier et le deuxieme domaines hypervariables ainsi que 
le site.de fixation au recepteur CD4 influent sur le degre d'immunite que Ton pourrait 
obtenir* 

25 

Un vaccin d'un interet general devrait permettre de proteger les individus contre la 
majority des souches virales HIV qui sevissent dans le monde. En consequence, un vaccin 
a base de gpl60 devrait contenir diverses gpl60, chacune d6rivee d'une souche virale 
differente. Afin de mettre en oeuvre un tel vaccin, il convient tout d'abord de construire 

30 les moyens destines a la production du variant gpl60 non-clivable et soluble, 
correspondant a chaque souche virale. En premiere approche, il s'agirait done a chaque 
fois de doner le fragment d'ADN codant pour la gpl60 d'une souche virale determinee, 
d'en determiner sa sequence, de modifier ce fragment d'ADN afin de supprimer par 
substitution ou d61etion des sites de clivage et des regions hydrophobes, puis enfin de 

35 placer ce fragment d'ADN ainsi modifie dans des conditions d'expression appropriees. 
Comme ce type d'operation devrait etre renouvelee pour chaque gpl60, la preparation 
d'un tel vaccin est prevue longue et couteuse. 

De plus, les souches virales peuvent varier au cours du temps e.g. par mutation. 
40 Telle souche, cause majeure de I'infection dans telle region du globe a tel moment, peut 
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regresser en tant qu'agent infectieux et telle autre souche apparaitre en remplacement. II 
est done important de pouvoir adapter rapidement un vaccin aux conditions 
epidemiologiques et, dans le cas present, de disposer d'un variant gpl60 dans les meilleurs 
delais. 

5 

A cette fin, on a maintenant trouve une nouvelle methode pour obtenir un variant 
gpl60 approprie quelque soit la souche virale consideree. Dans la raesure ou Ton dispose 
d'une cassette d'expression destinee a la production d'un variant gpl60 non-clivable et 
soluble derive d'une premiere souche virale, cette methode permet d'obtenir un variant 
10 similaire derive d'une deuxieme souche virale en evitant le clonage complet du fragment 
d'ADN codant pour la gpl60 de la deuxieme souche virale et les modifications qui 
devraient s'en suivre. 



En consequence, I'invention propose une methode pour construire une cassette 
15 d'expression comportant une unite d'ADN codant soit pour un precurseur d'un variant 
gpl60 hybride non-clivable et soluble, soit pour un variant gpl60 hybride non-clivable et 
soluble ; ledit variant ayant une sequence en acides amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
20 et situee dans cette derniere gpl60 de 1'acide amine en position X a Tacide 

amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306* 482; 



ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
25 A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 

dernier variant gpl60 de 1'acide amine en position Y + 1 a 1'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

Hi) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
30 deuxieme souche du virus HIV et situee dans cette derniere gpl60 de 1'acide 

amine en position 1 a I'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

35 

a) 1'acte de doner un fragment d'ADN codant pour ladite premiere region : et 

b) facte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

40 
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m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d 'initiation de traduction, 



iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

10 iv) quand X est tel que defini ci-dessus mais different de 1, une 

deuxieme region d'ADN codant pour ladite troisieme region de ia 
sequence en acides amines dudit variant gpl60 hybride ; et 



15 



n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 
amines dudit variant gpl60 hybride et 

20 ii) un codon de terminaison de traduction ; 

pour obtenir une cassette d'expression comportant ladite unite d'ADN. 

Une telle cassette d'expression est l'outil indispensable qui permet de produire un 
25 variant gpl60 hybride, soluble et non-clivable dans un systeme d'expression heterologue. 

Dans la methode selon Pinvention, le fragment d'ADN codant pour ladite premiere 
region peut etre clone selon n'importe quelle methode en usage. On indique cependant que 
ce clonage peut etre avantageusement effectue par la technique PCR a partir de I'ADN 
30 genomique de cellules infectees par ladite deuxieme souche du virus HIV. L'insertion du 
fragment d'ADN clone s'effectue dans des sites de restriction initialement presents dans 
la cassette ou crees a cet effet, par exemple en utilisant un polylinker de maniere 
appropriee. Une illustration de cette methode est presentee par la suite dans les exemples. 



35 Par "unite d'ADN codant pour un polypeptide quelconque", on entend un segment 

d'ADN dont le premier codon en position 5' et le dernier codon en position 3' codent 
respectivement pour le premier acide amine en position N-terminale et le dernier acide 
amine en position C-terminale du polypeptide. 

40 Selon un mode prefere, la methode selon Tinvention est mise en oeuvre pour 
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construire une cassette d 'expression comportant une unite d'ADN codant pour un 
precurseur d'un variant gpl60 hybride non-clivable et soluble. 

Par "precurseur d'un variant gpl60 selon Tinvention", on signifie un polypeptide 
5 comportant un peptide signal et un variant gpl60 mature ; I'extremite N-terminale dudit 
variant etant associee k I'extremite C-terminale du peptide signal par liaison peptidique. 
C6 precurseur est le produit initial de I'expression de I'unite d'ADN. II est en particulier 
present dans le cytoplasme de la cellule bote, associe en position N-terminale avec un 
residu methionine d'initiation de traduction. Le peptide signal permet d'initier le transfert 
10 du variant gpl60 dans le reticulum endoplasmique. Lors de ce transfert, le peptide signal 
est abandonne par clivage proteolytique pour donner la forme mature du variant gpl60. 
Dans la suite du texte, le terme "variant gpl60 n fait exclusivement reference a sa forme 
mature. 



15 Le peptide signal peut etre n'importe quel peptide signal en usage. II doit etre 

cependant choisi en tenant compte de l'organisme-hote destine a la production du variant . 
gpl60 selon I'invention. Par exemple, si Torganisme-hote est une cellule de mammifere, 
le peptide signal peut etre avantageusement selectionne parmi les peptides signal des 
precurseurs des gpl60 des differentes souches du virus HIV, independamment de I'origine 

20 : des premiere, deuxieme et troisieme regions du variant selon I'invention. De maniere 
alternative, on peut utiliser des peptides signal synthetiques. De tels peptides signal sont 
par exemple, des peptides signal hybrides dont I'extremite N-terminale derive du 
precurseur de la gpl60 de ladite deuxi&ne souche du vims HIV et dont I'extremite C- 
terminale derive du precurseur de la gpl60 de ladite premiere souche du virus HIV. A 

25 titre indicatit on mentionne de plus, que le peptide signal du precurseur de la 
glycoproteine d'une souche du virus de la rage peut etre aussi utilise. Enfin, Thomme du 
metier doit coraprendre que cette liste est non-limitative. 

L*invention propose de meme un variant gpl60 hybride, non-clivable et soluble, qui 
30 comprend : 

i) une premiere region derivee de la gpl60 d*une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de i'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
35 306 a 482 ; 



ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
demier variant gpl60 de l'acide amine en position Y + 1 a Tacide amine en 
40 position C-terminale, Y etant tel que defini ci-dessus ; et 
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iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gp!60 de 1'acide 
amine en position 1 h I'acide amin£ en position X - 1, X 6tant tei que d6fini 
ci-dessus. 

5 

La premiere, ainsi que la deuxieme et troisieme regions du variant gpl60 selon 
Tinvention peuvent etre ddrivees de la gpl60 de n'importe quelle souche du virus HIV, 
a condition que la premiere souche soit differente de la deuxieme. De maniere preferee, 
la premiere region derive de la gpl60 d'une souche virale selectionnee parmi les souches 
10 HIV-2 Rod, HIV-1 Eli, HIV-1 RF, HIV-1 SF2C, HIV-1 SC et HIV-1 MN, cette derniere 
etant plus particulierement pr6f6r£e. De meme, la deuxieme et troisieme regions ont de 
preference pour origine la gpl60 de la souche HIV-1 Bru. 

Par "variant gpl60 non-clivable de type A", on entend un variant gpl60 : 
15 - soit derive d'une gpl60 d'une souche virale de type HIV-1 et ne contenant plus 

le site de ciivage majeur, 

- soit derive d'une gpl60 d'une souche virale de type HIV-2 et ne contenant plus 
le site de ciivage. 

Lorsque le variant gpl60 derive d'une gpl60 d'une souche virale de type HIV-1, ce 
20 variant est de preference de type A* ; c'est-a-dire ne contenant ni le site de ciivage 
majeur, ni le site de ciivage mineur. 

Par "variant gpl60 soluble", on entend un variant gpl60 derive d'une gpl60 native 
qui ne contient plus de region transmembranaire ou dont la region transmembranaire 
25 native a 6l6 mutde de manifcre h ne plus pouvoir assurer sa fonction d'ancrage dans la 
membrane. De plus, un tel variant soluble peut avantageusement ne plus contenir de 
region hydrophobe. 

Par "cassette d'expression", on entend un segment d'ADN comprenant une unite 
30 d'ADN a exprimer ainsi que les elements necessaires a l'expression de cette derniere. 
L'expression d'une unite d'ADN est obtenue par transcription de cette unite d'ADN en 
ARN messager et par traduction de cet ARN messager en proteine. Par consequent, les 
elements indispensables sont un promoteur constitutif ou inductible (initiation de la 
transcription), un codon d'initiation de traduction (codon ATG) et un codon de fin de 
35 traduction (codon TAG, TAA ou TGA). En outre, une cassette d'expression peut aussi 
contenir d'autres elements ; par exemple, un terminateur de transcription. 

L'homme du metier sait bien evidemment choisir le promoteur et le terminateur 
appropries en fonction de l'organisme-hote dans lequel on souhaite exprimer I'unite 
40 d'ADN et en fonction du vecteur dans lequel la cassette d'expression doit etre inseree 
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pour assurer sa replication. 

En accord avec ce qui precede, Invention propose de meme, une cassette 
depression comportant une unite d'ADN codant soit pour un precurseur d'un variant 
5 gpl60 selon I'invention, soit pour un variant gpl60 selon 1'invention ainsi que les 
elements necessaires a expression de ladite unite d'ADN. 

Afin d 'assurer sa replication autonome dans un organisme hote, une cassette 
depression selon i'invention peut etre inseree dans differents types de vecteur ayant une 

10 origine de replication adaptee a Torganisme hote ; par exemple un plasmide ou un virus. 
Les vecteurs de type viral ont en particulier la capacite d'integrer dans leur genome une 
quantite substantielle d'ADN Stranger sans nuire a leur capacite de replication. Parmi 
ceux-ci, on compte par exemple, les poxvirus, tels que le virus de la vaccine, le poxvirus 
du canari et la poxvirus de la variole aviaire ; les baculovirus tels que et les adenovirus 

15 tel que I'Adenovirus-2 ou l'Adenovirus-5. 

Outre leur utilisation dans un systeme de production heterologue, certains de ces 
vecteurs de type viral peuvent etre fonctionnels a titre d'agent de vaccination. II s'agit en 
particulier des poxvirus et des adenovirus. 

20 

Cest pourquoi, I'invention concerne de meme un vecteur viral dans le genome 
duquel est insure une cassette d'expression selon Tinvention. 

Sous un autre aspect de I'invention, on procure aussi une cellule transformee par une 
25 cassette d'expression selon I'invention. La cassette d'expression qui transforme la cellule 
peut etre vehiculee par un plasmide ou, de maniere alternative, etre integree dans le 
genome de la cellule hote. 

L'organisme-hote destine a la production du variant gpl60 selon I'invention peut 
30 etre n'importe quel type de cellule, de preference eucaryote. Ceci inclut par exemple : des 
champignons tels que les Ievures, des cellules d'insectes et des cellules de mammiferes. 

L'invention propose, en outre, deux precedes alteraatife visant a la production d'un 
variant gpl60 selon Tinvention : 

35 

- Ie premier precede comprend Tacte de cultiver une cellule selon I'invention et 
Facte de recolter Iedit variant a partir de la culture, 

- le second procede comprend Tacte d'infecter une culture de cellules avec un 
40 vecteur viral selon I'invention et l'acte de recolter ledit variant a partir de la culture. 
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Un variant gpl60 ainsi qu'un vecteur viral selon finvention possedent une activite 
vaccinale a f encontre d'un virus HIV et, par consequent, sont utiles a titre de produits 
pharmaceutiques en particulier destines au traitement ou a la prevention du Sida. 

5 En consequence, Finvention propose : 

i) une composition pharmaceutique destinee au traitement curatif ou preventif du 
Sida qui comprend a titre d 'agent therapeutique au moins un variant gpl60 ou un vecteur 
viral selon finvention, 

10 

ii) une m&hode de traitement curatif ou preventif du Sida qui comprend facte 
d'administrer une quantite therapeutiquement effective d'un variant gpl60 ou d'un vecteur 
viral selon Pinvention a un patient ayant besoin d'un tel traitement. 

15 iii) f usage d'un variant gpl60 ou d'un vecteur viral selon finvention a titre d'agent 

therapeutique destine au traitement curatif ou preventif du Sida. 

De manure pr£fer6e, une composition pharmaceutique selon finvention peut 
contenir plusieurs variants gpl60 selon finvention ; chaque variant gpl60 poss&iant au 
20 moins un troisidme domaine hypervariable (boucle V 3 ) different des autres variants 
presents dans la composition. Une telle composition pharmaceutique devrait done 
permettre de proteger correctement un individu vis-a-vis de diverses souches HIV. 

Une composition pharmaceutique selon finvention peut contenir en outre d'autres 
25 agents therapeutiques comme, par exemple, un peptide correspondant essentiellement au 
troisieme domaine hypervariable d'une gpl60 (ci-apres appele peptide V 3 ). De preference, 
un tel peptide a une sequence substantiellement identique a la sequence du troisieme 
domaine d'un variant gpl60 comenu dans la composition pharmaceutique selon 
finvention. De maniere similaire, plusieurs peptides V 3 peuvent etre presents dans la 
30 composition. En particulier, si la composition pharmaceutique selon finvention contient 
differents variants gpl60, on peut bien evidemment y ajouter les peptides V 3 
correspondants. 

Une composition pharmaceutique selon finvention peut etre fabriquee de maniere 
35 conventionnelle. En particulier, on associe un variant gpl60 selon finvention avec un 
diluant ou un support acceptable d'un point de vue pharmaceutique. Enfin, une 
composition selon finvention peut contenir un adjuvant de vaccination tel que f alun. De 
maniere alternative, cet adjuvant peut etre ajoute a une composition selon finvention juste 
avant usage. 

40 
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Une composition selon 1'invention peut etre administree par n'importe quelle voie 
conventionnelle en usage dans le domaine des vaccins, en particulier par voie sous- 
cutanee, par exemple sous forme de solution ou de suspension injectable. L' administration 
peut avoir lieu en dose unique ou rep6tee une ou plusieurs fois apres un certain delai 
5 d'intervalle. Le dosage approprie varie en fonction de divers parametres, par exemple, de 
Tindividu traite ou du mode d'administration. 

De maniere alternative, une composition pharmaceutique selon T invention peut etre 
presentee comme partie d*un kit de traitement. A titre d'exemple, on indique qu'un tel kit 
10 peut contenir : 

- d'une part, une composition pharmaceutique contenant au moins un variant gpl60 
selon l'invention et, 

15 - d 'autre part, une composition pharmaceutique contenant au moins un peptide V 3 , 

- ainsi qu'une notice specifiant les instructions relatives a I* administration 
sequentielle ou concomitante des compositions pharmaceutiques contenues dans le kit. 

20 

L'invention est illustree ci-apres par reference aux figures suivantes: 

La Figure 1 presente la sequence des acides amines des precurseurs des gpl60 
natives des souches virales HIV-1 Bru (a), HIV-1 MN (b), HIV-1 Eli (c), fflV-1 RF (d) f 

25 fflV-1 SC (e) et HIV-1 SF2C (f). Les residus acides amines des sequences signal sont 
numerates de la position -1 a -29. Le residu methionine en position -30 correspond au 
codon d'initiation de traduction. Les residus acides amines des gpl60 matures sont 
numerates de la position 1 a 841. L'asterisque (*) symbolise Pidentite des residus acides 
amines a une position donnee tandis que le point (.) indique un changement conservatif 

30 (acides amines different, mais apartenant a une meme classe). 

La Figure 2 presente la sequence des acides amines des precurseurs des gpl60 
natives des souches virales HIV-1 Bru (a) et HIV-2 Rod (b). Les residus acides amines 
des sequences signal sont numerates de la position -1 a -29. Le residu methionine en 
35 position -30 correspond au codon d'initiation de traduction. Les residus acides amines des 
gpl60 matures sont numerates de la position 1 a 841. L'asterisque (*) symbolise fidentite 
des residus acides amines a une position donnee tandis que le point (•) indique un 
changement conservatif (acides amines differents, mais apartenant a une meme classe). 

40 La Figure 3 presente la sequence nucleotidique du fragment Pstl-PstI du vecteur 
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pTG1163 qui comporte la sequence codant pour un precurseur d'un variant gpl60-Bru 
non-clivable soluble (domaine transmembranaire absent) ainsi que la sequence en acides 
amines de ce precurseur. 

5 La Figure 4 shematise les etapes de la construction des bacteriophages M13TG4168 

et M13TG4174. 

La Figure 5 presente la sequence nucleotidique codant pour le precuiseur de la 
gpl20-MN ainsi que la sequence en acides amines de ce precurseur, Les oligonucleotides 
10 OTG2624 et OTG2625 destines a Pamplification d'un fragment d'ADN codant au moins 
pour le troisieme domaine hypervariable de la gpl20-MN sont representes au dessus de 
leur region d'hybridation. 

La Figure 6 presente la sequence nucleotidique codant pour le precurseur de la 
15 gpl20-Eli ainsi que la sequence en acides amines de ce precurseur. Les oligonucleotides 
OTG2624 et OTG2625 destines a Pamplification d'un fragment d'ADN codant au moins 
pour le troisieme domaine hypervariable de la gpl20-MN sont representes au dessus de 
leur region d'hybridation. 

20 La Figure 7 pr&ente la sequence nucleotidique codant pour le precurseur de la 

gpl20-RF ainsi que la sequence en acides amines de ce precurseur. Les oligonucleotides 
OTG2624 et OTG2625 destines a famplification d'un fragment d'ADN codant au moins : 
pour le troisieme domaine hypervariable de la gpl20-RF sont representes au dessus de 
leur region d'hybridation. 

25 

La Figure 8 presente la sequence nucleotidique codant pour le precurseur de la 
gpl20-SF2C ainsi que la sequence en acides amines de ce precurseur. Les oligonucleotides 
OTG2624 et OTG2625 destines a Famplification d'un fragment d'ADN codant au moins 
pour le troisieme domaine hypervariable de la gpl20-SF2C sont representes au dessus de 
30 leur region d'hybridation. 

Dans les exemples suivants, pour faciliter l'ecriture et la comprehension, on entend 
par "sequence signal", une sequence signal incluant le residu methionine d'initiation de 
traduction. 

35 
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Exemole 1 : Construction d'une cassette d'insertion porte par le bacteriophage 
M13TG4168. 

5 Tel que montre a la Figure 3, le fragment cTADN Pstl-PstI du plasmide pTGH63 

decrit dans la demande de brevet EPA 245 136 comporte une sequence d'ADN codant 
pour un precurseur d'un variant gpl60-Bru non-clivable et soluble. Ce fragment d'ADN 
Pstl-PstI est insere dans le bacteriophage M13mp701 (decrit par M.P. Kieny et aL Gene 
(1983) 26 : 91) prealablement digere par PstI pour donner le bacteriophage M13TG4137 
10 (Figure 4). La numdrotation des nucleotides du fragment Pstl-PstI telle que indiquee a la 
Figure 3 sert de reference dans la suite de Texemple 1. 

Le plasmide pTG1163 est coupe par PstI et Kpnl et le fragment d'ADN 
correspondant aux nucleotides 1 a 138 (Figure 3) est insere dans le bacteriophage 
15 M13TG130 (decrit par MP. Kieny et al. (1983), supra) prealablement digere par PstI et 
KpnL On obtient ainsi le bacteriophage M13TG4147 (Figure 4). 

Le bacteriophage M13TG4137 est coupe par BgUI, traite par I'enzyme klenow 
(Boehringer Mannheim) pour obtenir des extremit& franches, puis coupe par EcoRI. Le 
20 fragment EcoRI-BgllF issu de cette digestion et comportant la sequence correspondant aux 
nucleotides 1424 a 2644 (Figure 3) est insere dans le bacteriophage M13TG4147 
prealablement digere par EcoRVet EcoRI. On obtient ainsi le bacteriophage M13TG4158 
qui comporte : 

25 i) un fragment d'ADN correspondant aux nucleotides 1 a 138, 

ii) la sequence restante du polylinker du bacteriophage M13TG4147 c'est a dire 
ATCGCATGCG, 

30 iii) un fragment d'ADN correspondant aux nucleotides 1424 a 2644. 

Le bacteriophage M13TG4158 simple brin anti-sens, sert de matrice pour une 
mutation-deletion effectuee en utilisant la trousse Amersham et Toligonucleotide 
OTG2623 dont la sequence est la suivante : 

35 

j SpJjJf , StoaJf 

GGGGGTGGAAATGGGGCA GCATGC AT CCCGGG CACAGAATCACGTGGTGC . 
40 Cette mutagenese permet simultanement de deleter un fragment de 184 paires de 
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bases qui comporte les nucleotides 67 a 138, la sequence ATCGCATGCG et les 
nucleotides 1424 & 1525 et de creer les sites de coupure pour les enzymes SphI en 5' et 
Smal en 3* qui sont inseres entre les nucleotides 66 et 1526. On obtient ainsi le 
bacteriophage M13TG4168 qui comprend : 

5 

i) un fragment d'ADN correspondant aux nucleotides 1 a 66, 

ii) la sequence d'ADN GCATGCATCCCG comportant les sites de clivage des 
enzymes SphI et Smal, et 

10 

iii) un fragment d'ADN correspondant aux nucleotides 1526 a 2644. 



Exemple 2 : Construction d'une cassette d'expression destinee a la synthese d'un 
15 variant gpl60 hybride Bru-MN. 

Tel que montre a la Figure 5, le fragment d'ADN codant pour la majeure partie d'un 
precurseur de la gpl20-MN est clone par la technique d 'amplification genique PCR 
(Polym6rase Chain Reaction) mise en oeuvre a partir de l'ADN g^nomique de cellules 
20 humaines CEM infectees par la souche virale HIV1-MN. Ce clonage est effectue a l'aide 
des oligonucleotides OTG2624 et OTG2625 qui introduisent respectivement un site de 
coupure pour I'enzyme SphI en 5* du fragment d'ADN amplifie et un site de coupure pour 
I'enzyme Smal en 3' du fragment d'ADN amplifie. Les sequences de ces oligonucleotides 
sont les suivantes : 

25 

I W 

OTG2624 : GGCA GCATGC TCCTTGGGATATTGATGATCTG 

30 , SmaJf 

OTG2625 : CTTTG CCCGGG TGGGTGCTACTCCTAATGGTTC 

Le fragment d'ADN Sphl-Smal amplifie correspond aux nucleotides 53 a 1505 
35 represents a la Figure 5, compte tenu des modifications de sequence apportees par les 
oligonucleotides OTG2624 et OTG2625. Ce fragment est insere dans le bacteriophage 
M13TG4168 coupe par SphI et Smal. On obtient ainsi le bacteriophage M13TG4174 qui 
comporte un fragment d'ADN codant pour un precurseur d'une proteine gpl60 hybride 
Bru-MN. Le fragment PstI du bacteriophage M13TG4174 qui code pour le variant gpl60 
40 hybride Bru-MN est insere dans le plasmide de transfert pTGl86poly (decrit par M.P. 
Kieny et aL Biotechnology, (1986) 4 : 790), en aval du promoteur E7.5k et a Pinterieur 
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du gene du virus de la vaccine codant pour la thymidine kinase* On obtient ainsi le 
plasmide pTG5156. 

Le plasmide pTG5156 est utilise par la suite pour transferer le bloc d'expression de 
5 la proteine gpl60 hybride Bru-MN dans le genome du virus de la vaccine, souche 
Copenhagen, selon la methode decrite par M.P. Kieny et al. Nature (1984), 312, 163-166). 
On obtient ainsi le vecteur de la vaccine VVTG5156. 



10 Exemple 3 : Construction d'une cassette d'expression destinee a la synthese d'un 
variant gpl60 hybride Bru-EIL 

Le plasmide pTG186po!y est coupe par BamHI, traite par l'enzyme Klenow, coupe 
par Smal pour deleter la majeure partie du polylinker, puis religud sur lui-meme pour 
15 donner le plasmide pTGl86PE Le polylinker ne conserve plus que les sites de clivage 
pour les enzymes PstI, Sail et EcoRL 

Le fragment d'ADN Psd-Pstl du bacteriophage M13TG4168 decrit, ci-dessus, qui 
comporte ; 

20 

i) un fragment d'ADN correspondant aux nucleotides 1 a 66 du fragment d'ADN 
represente sur la Figure 3, 

ii) la sequence d'ADN GCATGCATCCCG comportant les sites de clivage des 
25 enzymes SphI et Smal, el 



iii) un fragment d'ADN correspondant aux nucleotides 1526 a 2644 du fragment 
d'ADN represente a la Figure 3, 



30 est insere dans le plasmide pTG186PE prelablement coupe par PstI, en aval du promoteur 
E7.5k et k rinterieur du gene du virus de la vaccine codant pour la thymidine kinase. On 
obtient ainsi le plasmide pTG5160. 

Tel que montre a la Figure 6, le fragment d'ADN codant pour la majeure partie d'un 
35 precurseur de la gpl20-EIi est clone par la technique d'amplification genique PCR mise 
en oeuvre a partir de l'ADN genomique de cellules humaines CEM infectees par du virus 
fflVl-EIi. Ce clonage est effectue a T aide des oligonucleotides OTG2624 et OTG2625 qui 
introduisent respectivement un site coupure pour l'enzyme SphI en 5' du fragment d'ADN 
amplifie et un site de coupure pour l'enzyme Smal en 3' du fragment d'ADN amplifie. 
40 Le fragment d'ADN Sphl-Smal amplifie correspond aux nucleotides 53 a 1490 representes 
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a la Figure 6, compte tenu des modifications de s6quence apportees par les 
oligonucleotides OTG2624 et OTG2625. Ce fragment est insere dans le bacteriophage 
M13TG131 (decrit par MP. Kieny et ah (1983), supra) prealablement coupe par SphI et 
Smal pour donner Ie bacteriophage M13TG4197. Puis le fragment Sphl-Smal du 
5 bacteriophage M13TG4197 est insere dans le plasmide de transfert pTG5160 (decrit ci- 
dessus) prealablement coupe par SphI et Smal. On obtient ainsi le pTG5193. 

plasmide pTG5193 est utilise par la suite pour transferer le bloc depression de 
la protdine gpl60 hy bride Bru-EIi dans le genome du virus de la vaccine, souche 
10 Copenhagen, selon la methode decrite par M.P. Kieny et al. (1984) supra. On obtient ainsi 
le vecteur de la vaccine VVTG5193. 



Exemple 4 : Construction d'une cassette d 'expression destinee a la synthese d'un 
15 variant gpl60 hybride Bru-RF. 

Tel que montre a la Figure 7, le fragment d'ADN codant pour la majeure partie d'un 
precurseur d'une proteine gpl20-RF est clone par la technique d'amplification genique ■ 
PCR mise en oeuvre k partir de l'ADN genomique de cellules humaines CEM infectees ; 

20 par du virus fflVl-RF. Ce clonage est effectue a l'aide des oligonucleotides OTG2624 et 
OTG2625 qui introduisent respectivement un site de coupure pour Penzyme SphI en 5* 
du fragment d'ADN amplifie et un site de coupure pour Tenzyme Smal en 3' du fragment 
d'ADN amplifi6. Le fragment d'ADN Sphl-Smal amplifie correspond aux nucleotides 53 • 
a 1523 representes a la Figure 7, compte tenu des modifications de sequence apportees 

25 par les oligonucleotides OTG2624 et OTG2625. Ce fragment est insere dans le 
bacteriophage M13TG131 prealablement coupe par SphI et Smal pour donner le 
bacteriophage M13TG4198. Puis le fragment Sphl-Smal du bacteriophage M13TG4198 
est insera dans le plasmide de transfert pTG5160 (decrit a Texemple 3) prealablement 
coupe par SphI et Smal. On obtient ainsi le pTG5194. 

30 

Le plasmide pTG5194 est utilise par la suite pour transferer le bloc d'expression de 
la proteine gpl60 hybride Bru-RF dans Ie genome du virus de la vaccine, souche 
Copenhagen, selon la methode decrite par MP. Kieny et al. (1984) supra. On obtient ainsi 
le vecteur de la vaccine VVTG5194. 



Exemple 5 : Construction d'une cassette d 'expression destinee a la synthese d'un 
variant gpl60 hybride Bru-SF2G 



40 



Tel que montre a la Figure 8, le fragment d'ADN codant pour la majeure partie d'un 
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precuiseur de la gpl20-SF2C est clone par la technique d'amplification genique PCR mise 
en oeuver k partir de TADN genomique de cellules humaines CEM infectees par du virus 
fflVl-SF2C. Ce clonageest effectue a Paide des oligonucleotides OTG2624 et OTG2625 
qui introduisent respectivement un site de coupure pour I'enzyme SphI en 5' du fragment 
5 d'ADN amplifie et un site de coupure pour I'enzyme Smal en 3* du fragment d'ADN 
amplifie. Le fragment d'ADN Sphl-Smal amplifie correspond aux nucleotides 53 a 1493 
representes a la Figure 8, compte tenu des modifications de sequence apportees par les 
oligonucleotides OTG2624 et OTG2625. Puis ce fragment est insert dans le bacteriophage 
M13TG131 prealablement coupe par SphI et Smal pour donner le bacteriophage 
10 M13TG4199. Le fragment Sphl-Smal du bacteriophage M13TG4199 est insere dans le 
plasmide de transfert pTG5160 (decrit a l'exemple 3) prealablement coupe par SphI et 
Smal. On obtient ainsi le pTG5195. 

Le plasmide pTG5195 est utiiisd par la suite pour transferer le bloc depression de 
15 la proteine gpl60 hybride Bru-SF2C dans le genome du virus de la vaccine, souche 
Copenhagen, selon la methode decrite par M.P. Kieny et al. (1984) supra. On obtient ainsi 
le vecteur de la vaccine VVTG5195. 

20 Exemoles 6 a 9 : Production et purification des gpl60 hybrides Bru-MN, Bru-EIi, 

Bru-RF et Bru SF2C : 

Des cellules BHK-21 sont cultivees dans un milieu GMEM (Gibco) supplement^ 
avec 10% de serum de veau foetal (SVF). Lorsque les cellules sont a confluence 

25 (5,8xl0 6 cellules/ml), le milieu de culture est enleve et le tapis cellulaire est lave 2 fois 
avec 50 ml de PBS (Dubelcco's phosphate buffer salt ; Seromed). Puis du milieu GMEM 
frais sans SVF est rajoute. On ajoute alors un des virus de la vaccine VVTG5156, 
VVTG5193, VVTG5194 et VVTG5195 decrits ci-dessus dans les exemples 2 a 5, a une 
infectivitfi de 1 ufp/cellule (unite formant plages), et Tinfection est poursuivie pendant 72 

30 h. Le lysat est alors centrifuge 20 min. a 10 000 g pour eliminer les debris cellulaires et 
on recupere le surnageant contenant entre autre une gpl60 hybride et des virions. 

A 20 ml de surnageant de culture obtenu comme precedemment decrit, on ajoute 1,3 
ml d'une solution de chlorure de zinc (ZnCy a 1 M pour avoir une concentration finale 
35 en ZnCl 2 de 60 mM. Le melange est laisse 1 h dans de la glace ; puis le surnageant de 
precipitation est recupere apres centrifugation a 3000 t/min. pendant 20 min. dans une 
centrifugeuse Minifiige RF Heraeus. Cette methode elimine par precipitation les virions 
ainsi que la majority des proteines contaminantes. Dans chaque cas, on obtient ainsi une 
solution purifiee du variant gpl60 hybride. 
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REVENDICATIONS 

1. Une methode pour construire une cassette d 'expression comportant une unite d'ADN 
codant soit pour un precurseur d'un variant gpl60 hybride, non-clivable et soluble, 
soit pour un variant gpl60 hybride, non-clivable et soluble ; ledit variant gpl60 
ayant une sequence en acides amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette demiere gpl60 de 1'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y 6tant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette demiere gp!60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

a) 1'acte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) 1'acte dMnserer le fragment d'ADN clon6 en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d'initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

iv) quand X est tel que defini ci-dessus mais different de K une 
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deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
5 codant pour ladite deuxieme region de la sequence en acides 

amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

10 pour obtenir une cassette d' expression comportant ladite unite d'ADN. 



15 
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2. Une methode selon la revendication 1, pour construire une cassette d 'expression 
comportant une unit6 d'ADN codant pour un precurseur d'un variant gpl60 hybride, 
non-clivable et soluble, ayant une sequence en acides amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de l'acide amine en position X a l'acide 

• amind en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 

306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de Tacide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

a) facte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) i'acte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
35 comprend : 



25 



30 



WO 92/19742 



PCT/FR92/00394 



10 



15 



20 



25 



30 



- 21 - 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d'initiation de traduction, 

iii) une premiere region d'ADN codant pour un peptide signal, et 

iv) quand X est tel que defmi ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que d^fini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 

- amin& dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour pbtenir une cassette depression comportant ladite unite d'ADN. 



3. Une methode selon la revendication 1, pour construire une cassette d'expression 
comportant une unite d'ADN codant soil pour un precurseur d'un variant gpl60 
hybride, non-clivable et soluble, soit pour un variant gpl60 hybride, non-clivable et 
soluble ; ledit variant gpl60 ayant une sequence en acides amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de l'acide amine en position X a Tacide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 & 476 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gp!60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

35 iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 

deuxieme souche du virus HIV et situee dans cette derniere gp!60 de Tacide 
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amine en position 1 a Pacide amine en position X - 1, X etant tei que defini 
ci-dessus ; 

Iadite methode comprenant : 

a) Tacte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) facte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d' initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

iv) quand X est tei que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en abides amin& dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tei que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 
amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour obtenir une cassette depression comportant ladite unite d'ADN. 

4. Une methode selon la revendication 1 ou 3, pour construire une cassette 
d'expression comportant une unite d'ADN codant soit pour un precurseur d'un 
variant gpl60 hybride, non-clivable et soluble, soit pour un variant gpl60 hybride, 
non-clivable et soluble ; ledit variant ayant une sequence en acides amines 
comprenant : 
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i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de Tacide amine en position X a Tacide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de Tacide amine en position Y + 1 a Tacide amine en 
position C-terminaie, Y etant tel que defini ci-dessus et ladite deuxieme 
souche etant la souche HIVl-Bru ; et 

iii) quand X est different de 1, une troisieme region derivee de ia gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de Tacide 
amine en position 1 a Tacide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

a) Tacte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) Tacte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d'initation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

iv) quand X est tel que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de Ia sequence en acides 
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amines dudit variant gpl60 hy bride et 
ii) un codon de terminaison de traduction ; 
pour obtenir une cassette depression comportant ladite unite d'ADN. 

5 

5. Une methode selon n'importe laquelie des revendications 1, 3 et 4, pour construire 
une cassette d'expression comportant une unite d'ADN codant soit pour un 
precuiseur d'un variant gpl60 hybride, non-clivable et soluble, soit pour un variant 
gpl60 hybride, non-clivable et soluble ; ledit variant ayant une sequence en acides 
IQ amines comprenant : 

i) une premiere region derivee de ia gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de I'acide amin6 en position X a I'acide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 et ladite premiere souche etant selectionnee panni les souches HIV- 

15 1 MN, HIV-1 Eli, HIV-1 RF, HIV-1 SF2C et HIV-1 SC; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de Pacide amine en position Y + la I'acide amine en 

20 position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxifcme souche du virus HIV et situee dans cette derniere gpl60 de I'acide 
amine en position 1 a I'acide amine en position X - 1, X etant tel que defini 

25 ci-dessus ; 

ladite methode comprenant : 

a) Pacte de doner un fragment d'ADN codant pour ladite premiere region ; et 



30 



b) Pacte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 



35 



i) un promoteur, 
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ii) un codon d'initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 



iv) quand X est tel que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 



10 0 quand Y est tel que defini ci-dessus, une troisieme region d'ADN 

codant pour ladite deuxieme region de ia sequence en acides 
amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour obtenir une cassette d 'expression comportant ladite unite d'ADN. 

Une methode selon la revendication 5, pour construire une cassette d 'expression 
comportant une unite d'ADN codant soit pour un precurseur d'un variant gpi60 
hybride, non-clivable et soluble, soit pour un variant gpl60 hybride, non-clivable et 
soluble ; ledit variant ayant une sequence en acides amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de I'acide amine en position X a I'acide 
25 amin£ en position Y, X 6tant un nombre de 1 a 271 et Y £tant un nombre de 

306 a 482 et ladite premiere souche etant la souche HIV-1 MN; 



6. 
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ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de I'acide amine en position Y + 1 a I'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gp!60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de I'acide 
amine en position 1 a I'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 
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ladite methode comprenant : 

a) I'acte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) Pacte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

5 

m) en amont du site et en sequence : 

i) un promoteur, 

10 ii) un codon d'initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 
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iv) quand X est tel que defini ci-dessus ma is different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 
amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour obtenir une cassette d'expression comportant ladite unite d'ADN. 



Une methode selon n'importe laquelle des revendications I et 3 a 6, pour construire 
une cassette d'expression comportant une unite d'ADN codant soit pour un 
precurseur d'un variant gpl60 hybride, non-clivable et soluble, soit pour un variant 
gpl60 hybride, non-clivable et soluble ; ledit variant ayant une sequence en acides 
amines comprenant : 
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une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette deraiere gpl60 de I'acide amine en position X a Tacide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
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450 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-ciivable de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de I'acide amine en position Y + 1 a I'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de I'acide 
amine en position 1 a I'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

a) Facte de doner un fragment d'ADN codant pour ladite premiere region ; et 

b) l'acte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d'initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

iv) quand X est tel que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 
amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 
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pour obtenir une cassette d'expression comportant ladite unite d'ADN. 

8. Une methode selon n'importe laquelle des revendications 1 et 3 a 7, pour construire 
une cassette depression comportant une unite d'ADN codant soit pour un 
precurseur d'un variant gpl60 hy bride, non-clivabie et soluble, soit pour un variant 
5 gpl60 hybrids non-clivabie et soluble ; ledit variant ayant une sequence en acides 

amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de Pacide amine en position X a Pacide 

10 amine en position Y, X etant un nombre de 1 a 97 et Y etant un nombre de 

306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivabie de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de Pacide amine en position Y + 1 a Pacide amine en 

15 position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de Pacide 
amine en position 1 a Pacide amine en position X - 1, X etant tel que defini 

20 ci-dessus ; 

ladite methode comprenant : 

Pacte de doner un fragment d T ADN codant pour ladite premiere region : et 

Pacte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 
i) un promoteur. 



a) 

25 

b) 
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ii) 
iii) 



un codon ({'initiation de traduction, 



en option, une premiere region d'ADN codant pour un peptide 
signal, et 
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iv) quand X est tel que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 

i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la s6quence en acides 
amines dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour obtenir une cassette depression comportant ladite unite d'ADN. 

Une methode selon n'importe laquelle des revendications 1 et 3 a 8, pour construire 
une cassette d'expression comportant une unite d'ADN codant soit pour un 
precurseur d'un variant gpl60 hybride, non-clivable et soluble, soit pour un variant 
gpl60 hybride, non-clivable et soluble ; ledit variant ayant une sequence en acides 
amines comprenant : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situfe dans cette demiere gpl60 de l'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de 1 a 97 et Y etant un nombre de' 
306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A* ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que d6fini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette demiere gp!60 de facide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus ; 

ladite methode comprenant : 

a) l'acte de doner un fragment d'ADN codant pour ladite premiere region par 
la technique PCR a partir de l'ADN genomique de cellules infectees par ladite 
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deuxieme souche du virus HIV ; et ' 

b) facte d'inserer le fragment d'ADN clone en a) dans un site d'une cassette qui 
comprend : 

m) en amont du site et en sequence : 

i) un promoteur, 

ii) un codon d'initiation de traduction, 

iii) en option, une premiere region d'ADN codant pour un peptide 
signal, et 

iv) quand X est tel que defini ci-dessus mais different de 1, une 
deuxieme region d'ADN codant pour ladite troisieme region de la 
sequence en acides amines dudit variant gpl60 hybride ; et 

n) en aval du site et en sequence : 



i) quand Y est tel que defini ci-dessus, une troisieme region d'ADN 
codant pour ladite deuxieme region de la sequence en acides 

20 amin& dudit variant gpl60 hybride et 

ii) un codon de terminaison de traduction ; 

pour obtenir une cassette d'expression comportant ladite unite d'ADN. 



10. Un variant gpl60 hybride, non-clivable et soluble, ayant une sequence en acides 
amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de Pacide amine en position X a Tacide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 ; 



ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
35 dernier variant gpl60 de Pacide amine en position Y + 1 a Pacide amine en 

position C-terminale, Y etant tel que defini ci-dessus ; et 
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iii) quand X est different de 1, une troisieme region derivee de la gpl60 de iadite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. 



11. Un variant gpl60 hy bride, non-clivable et soluble selon la revendication 10, ayant 
une sequence en acides amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gp!60 de l'acide amine en position X a Pacide 
amin6 en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 k 476 ; 

ii) une deuxieme region derivee d'un variant gp!60 soluble, non-clivable de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amin^ en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de Iadite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. 



12. Un variant gpl60 hybride, non-clivable et soluble selon la revendication 10 ou 11, 
ayant une sequence en acides amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de l'acide amine en position X a l'acide 
amine en position Y, X 6tant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 ; 

ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus et Iadite deuxieme 
souche etant la souche HIV-1 Bru ; et 

' iii) quand X est different de 1, une troisieme region derivee de la gpl60 de Iadite 
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deuxieme souche du virus HIV et situee dans cette demiere gpl60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. 



13. Un variant gpl60 hybride, non-clivable et soluble selon n'importe laquelle des 
5 revendications 10 a 12, ayant une sequence en acides amines qui comprend : 

i) une premiere region derivee de ia gpl60 d'une premiere souche du virus HIV 
et situee dans cette demiere gpl60 de l'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de I a 271 et Y etant un nombre de 
l 0 306 a 482 et ladite premiere souche etant selectionnee parmi ies souches HIV- 

1 MN, HIV-1 Eli, HIV-i RF, HIV-1 SF2G et HIV-1 SC; 
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ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 



iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette demiere gpl60 de facide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
20 ct-dessus. 



14. Un variant gpl60 hybride, non-clivable et soluble selon Ia revendication 13, qui 
comprend : 

25 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette demiere gpl60 de l'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
306 a 482 et ladite premiere souche etant la souche HIV-1 MN; 

30 ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 

A ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

35 iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 

deuxieme souche du virus HIV et situee dans cette demiere gpl60 de l'acide 
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aminS en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. 



15 
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15. Un variant gpl60 hybride, non-ciivable et soluble selon n'importe laquelle des 
revendications 10 a 14, ayant une sequence en acides amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
et situee dans cette derniere gpl60 de l'acide amine en position X a l'acide 
amine en position Y, X etant un nombre de 1 a 271 et Y etant un nombre de 
450 & 482 ; 

ii) une deuxieme region derivee d'un variant gp!60 soluble, non-clivable de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette dernifere gpl60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. .-. . 



16. Un variant gpl60 hybride, non-clivable et soluble selon n'importe laquelle des 
revendications 10 a 15, ayant une sequence en acides amines qui comprend : 

i) une premiere region derivee de la gpl60 d'une premiere souche du virus HIV 
25 et situee dans cette derniere gpl60 de Pacide amine en position X a l'acide 

amin6 en position Y, X etant un nombre de 1 a 97 et Y etant un nombre de 
306 a 482 ; 



ii) une deuxieme region derivee d'un variant gpl60 soluble, non-clivable de type 
A' ayant pour origine une deuxieme souche du virus HIV et situee dans ce 
dernier variant gpl60 de l'acide amine en position Y + 1 a l'acide amine en 
position C-terminale, Y etant tel que defini ci-dessus ; et 

iii) quand X est different de 1, une troisieme region derivee de la gpl60 de ladite 
deuxieme souche du virus HIV et situee dans cette derniere gpl60 de l'acide 
amine en position 1 a l'acide amine en position X - 1, X etant tel que defini 
ci-dessus. 
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17. Une cassette d'expression obtenue par une methode selon n'importe laquelle des 
revendications 1 a 9. 



18. Une cassette d'expression comportant une unitg d'ADN codant soit pour un 
precurseur d'un variant gpl60 selon n'importe laquelle des revendications 10 a 16 
soit pour un variant gp!60 selon n'importe laquelle des revendications 10 a 16 et 
les elements necessaires a expression de ladite unitd d'ADN. 



10 19. Une cellule transformee par une cassette d'expression selon la revendication 17 ou 
18. 



15 



20 



30 



20. Un vecteur viral dans le genome duquel est insere une cassette d'expression selon 
la revendication 17 ou 18. 



21. Un proced6 pour produire un variant gpl60 selon n'importe laquelle des 
revendications 10 a 16, qui comprend l'acte de cultiver une cellule selon la 
revendication 19 et l'acte de recolter ledit variant a partir de la culture. 



22. Un precede pour produire un variant gpl60 selon n'importe laquelle des 
revendications 10 a 16, qui comprend l'acte d'infecter une culture de cellules avec 
un vecteur viral selon la revendication 20 et l'acte de recolter ledit variant a partir 

25 de la culture. 

23. Une composition pharmaceutique destinee a la prevention ou au traitement du Sida. 
qui comprend, a titre d'agent therapeutique, un variant gpl60 selon n'importe 
laquelle des revendications 10 a 16. 



24. Une composition pharmaceutique destinee a la prevention ou au traitement du Sida, 
qui comprend, a titre d'agent therapeutique, un vecteur viral selon la revendication 
20. 
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Figure 1 



-30 -25 -20 -15 -10 -5 1 5 10 15 20 25 

: ::::::::::: 

a ) MRVKE KYQHLWRWGWKWGTMLLGILMICSATEKLWVTVYYGVPVWKEATTTLFCASD 

b ) MRVKGIRRNYQH-W WGWGTMLLGLLMICSATEKLWVTVYYGVP VWKEATTTLFCAS D 

c ) MRARGIERNCQN-W WKWGIMLLGILMTCSAADNLWVTVYYGVPVWKEATTTLFCASD 

d ) MRVMEMRKNCQHLWKW GTMLLGMLMI C S AAE DLWVTVYYG VP VWKEATTTLFCAS E 

e) MRVKGSGRNYQHLWRWG TMLLGILMICSAAEQLWVTVYYGVPVWKEATTTLFCASD 

f ) MKVKGTRRNYQHLWRW GTLLLGMLMICSATEKLWVTVYYGVPVWKEATTTLFCASD 

..*• * # # . *********************** ^ 



30 35 40 45 50 55 60 65 70 75 80 85 
:::::::::::: 

a) AKAYDTEVHNVWATHACVPTDPNPQEWLVNVTENFNMWKNDMVEQMHEDIISLWDQSLK 

b) AKAYDTEVHNVWATQACVPTDPNPQEVELVNVTENFNMWKNNMVEQMHEDIISLWDQSLK 

c) AKSYETEAHNIWATHACVPTDPNPQEIALENVTENFNMWKNNMVEQMHEDIISLWDQSLK 

d ) AKAYKTEVHNVWAKHACVPTDPNPQEVLLENVT^ 

e ) AKAYDTEVHNIWATHACVPTDPNPQEWLGNVTENFNMWKNNMVEQMHEDI ISLWDQSLK 

f ) ARAYDTEVHNVWATHACVPTDPNPQEWLGNVTENFNMWKNNMVEQMQEDI ISLWDQSLK 



90 95 100 105 110 115 120 125 130 135 140 145 
s 5 : : : : : : : : : : 

a ) PCVKLTPLCVSLKCTDLGNATNTN-SSNTNSSSGEMMMEKGEIKNCSFNISTSIRGKVQK 

b) PCVKLTPLCVTLNCTDLRNTTNTNNSTANNNSNSEGTIKGGEMKNCSFNITTSIRDKMQK 
C) PCVKLTPLCVTLNCSDELRNNGTMGNNVTTEEKG- — * MKNCSFNVTTVLKDKKQQ 

d ) PCVKLTPLCVTLNCTD ANLNGTNVTSSSGGTMMENGEIKNCSFQVTTSRRDKTQK - 

e) PCVKLTPLCVTLNCTNLRNDTSTN-ATNTTSSNRGKM-EGGEMTNCSFNITTSIRSKVQK 

f ) PC VKLTPLCVTLNCTDLGKATNTN-SSNWKEE I KGE IKNCS FN I TTS I RDK I QK 

**********.*.*.. ..****...* *. 



150 155 160 165 . 170 175 180 185 190 

: : : : : : : : : 

a) E YAFF YKLD 1 1 P I D NDTTS — YTLTSCNTSVITQACPKVSFEPIPIHYC 

b) EYALLYKLDIVSID NDSTS YRLISCNTSVITQACPKISFEPIPIHYC 

c) VYALF YRLD I VP I DNDS STNSTNYRLINCNTSAITQACPKVSFEPIPIHYC 

d) KYALFYKLDWPIEKGNISPKNNTSNNTSYGNYTLIHCNSSVITQACPKVSFEPIPIHYC 

e) E Y AL F YKLD WP I D N--TS YTLINCNTSVITQACPKVSFEPIPIHYC 

f ) ENALFRNLD WP I D NAS TTTN YTN YRL I HCNRS VI TQ AC PK VS FEPIPIHYC 
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Figure 1 (suite) 



195 200 205 210 215 220 225 230 235 240 245 250 
:::::::::::: 

a) APAGFAILKCNNKTFNGTGPCTNVSTVQCTHGIRPWSTQLLLNGSLAEEEWIRSANFT 

b) APAGFAILKCNDKKFSGKGSCKNVSTVQCTHGIRPWSTQLLLNGSLAEEEVVIRSENFT 
C ) APAGFAILKCRDKKFNGTGPCTNVSTVQCTHGIRP WSTQLLLNGSLAEEE VI IRSENLT 

d) TPAGFAILKCNDKKFNGTGPCKNVSTVQCTHGIRPVVSTQLLLNGSLAEEEWIRSENFT 

e) ARW-FAILNCNNKKFNGTGPCTNVSTVQCTHGIRPWSTHLLLNGSLAEEEWLRSENFT 

f ) TPAGFAILKCNNKTFNGKGPCTNVSTVQCTHGIRPIVSTQLLLNGSLAEEEWIRSDNFT 

****.*..★.*.*.*.*.******** ***** # *** # ************ - **** 

255 260 265 270 275 280 285 290 295 300 305 310 

a) DNAKTIIVQLNQSVEINCTRPNNNTRKSIRIQRGPGRAFVTIGKI-GNMRQAHCNISRAK 

b) DNAKTIIVHLNESVQINCTRPNYNKRKRIHI-- GPGRAFYTTKNIIGTIRQAHCNISRAK 

c) NNAKNIIAHLNESVKITCARPYQNTRQRTPI — GLGQSLYTT-RSRSIIGQAHCNISRAQ 

d) DNVKTIIVQLNASVQINCTRPNNNTRKSIT— KGPGRVIYATGQIIGDIRKAHCNLSRAQ 

e) DNAKTI I VQLKEAVE INCTRPNNNTTRS IH I — GPGRAFYATGDI I GD IRQAHCNI SRAK 

f ) NNAKTIIVQLNESVAINCTRPNNNTRKSIYI— GPGRAFHTTGRIIGDIRKAHCNISRAQ 
•*.*.**..*.•.* *.*.** * # ... **.... . . .****.*★*. 

315 320- 325 330 335 340 345 350 355 360 365 370 
: s : . : : : : : : : : : 

a ) / WNATLKQIASKLREQFGNNKTII-FKQSSGGDPEIVTHSFNCGGEFFYCNSTQLFNSTWF 

b ) WNDTLRQIVSKLKEQF-KNKTIV-FNQSSGGDPEIVMHSFNCGGEFFYCNTSPLFNSTWN 

c) WSKTLQQVARKLGTLL— NKTIIKFKPSSGGDPEITTHSFNCGGEFFYCNTSGLFNSTWN 

d ) WNNTLKQWTKLREQF-DNKTIV-FTSSSGGDPEIVLHSFNCGGEFFYCNTTQLFNSTWN 

e) WNNTLKQIVIKLRDQF-ENKTII-FNRSSGGDPEIVMHSFNCGGEFFYCNSTQLFSSTWN 

f ) WNNTLEQIVKKLREQFGNNKTIV-FNQSSGGDPEIVMHSFNCRGEFFYCNTTQLFNN 

*. ** *.. ** . . ★ ***. *. ********. ***** ******* #- **.. 

375 380 385 390 395 400 405 410 415 420 425 430 

a) -NSTWSTEGSNNTEGSDTITLPCRIKQFINMWQEVGKAMYAPPISGQIRCSSNITGLLLT 

b) GNNTWN NTTGSNNNITLQCKIKQIINMWQEVGKAMYAPPIEGQIRCSSNITGLLLT 

C) I-SAWNNITESNNSTNTNITLQCRIKQIIKM-VAGRKAIYAPPIERNILCSSNITGLLLT 

d) S TEGSNNTGGNDTITLPCRIKQIVNMWQEVGKAMYAPPISGQIKCISNITGLLLT 

e) GTEGSNNTGGNDTITLPCRIKEIINMWQEVGKAMYAPPIKGQVKCSSNITGLLLT 

f ) TWRLNHTEGTKGNDTIILPCRIKQIINMWQEVGKAMYAPPIGGQISCSSNITGLLLT 

*.*.*.**....* . **.***** 9m * ********* 
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Figure 1 (suited 



435 440 445 450 455 460 465 470 475 480 485 

a ) RDGGNNNNGS E IFRPGGGDMRDNWRS ELYKYKWKIEPLGVAPTKAKRRWQREK 

b ) RDGGKDTD TNDTE I FRPGGGDMRDNWRSEL YKYKWTIEPLGVAPTKAXRRWQREK 

c ) RDGGINN STNETFRPGGGDMRDNWRSELYKYKWQIEPLGVAPTRAKRRWEREK 

d ) RDGGEDT TNTTEIFRLGGGNMRDNWRSELYKYKWRIEPLGVAPTRAKRRVVQREK 

e ) RDGGNSKNGSKNENTEIFRPGGGDMRDNWRSELYKYKWKIEPLGVAPTKAKRRWQREK 

f ) RDGGTNV TNDTEVFRPGGGDMRDNWRSELYKYKVIKIEPLGIAPTKAKRRWQREK 

**** . *.** *****.***.******.*** 



490 495 500 505 510 515 520 525 530 535 540 
: - : : : : : : : : : : 

a ) RAVG-IGALFLGFLGAAGSTMGARSMTLTVQARQLLSGIVQQQNNLLRAIEAQQHLLQLT 

b ) RA — AIGALFLGFLGAAGSTMGAASVTLTVQARLLLSGIVQQQNNLLRAIEAQQHMLQLT 

c ) RAIG-LGAMFLGFLGAAGSTMGARSVTLTVQARQLMSGIVQQQNNLLRAIEAQQHLLQLT 

d ) RAVGTIGAMFLGFLGAAGSTMGAGSITLTVQARHLLSGIVQQQNNLLRAIEAQQHLLQLT 

e ) RAVGTIGAMFLGFLGAAGSTMGATSMTLTVQARLLLSGIVQQQNNLLRAIEAQQHLLQLT 
-f ) RAVGIVGAMFLGFLGAAGSTMGAVSLTLTVQARQLLSGIVQQQNNLLRAIEAQQHLLQLT 

'** .**.************** *.******* *.*******************.**** 



545 550 555 560 565 570 575 580 585 590 595 600 
5 '• '• : : : : : : : : : 

a ) VWGIKQLQARILAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLEQIWNNMTWM 

b) VWGIKQLQARVLAVERYLKDQQLLGFWGCSGKLICTTTVPWNASWSNKSLDDIWNNMTWM 
C) VWG IKQLQARI LAVER YLKDQQLLGIWGCSGKH ICTTNVP WNS S WSNRSLNE I WQNMTWM 

d) VWGIKQLQARVLAVERYLRDQQLLGIWGCSGKLICTTTVPWNASWSNKSLNMIWNNMTWM 

e ) VWGIKQLQARVLAVERYLRDQQLLGIWGCSGKLICTTTVPWNTSWSNKSLDKIWGNMTWM 

f ) VWGIKQLQARVLAVERYLRDQQLLGIWGCSGKLICTTAVPWNASWSNKSLEDIWDNMTWM 
**********. *******. »***.**. ** ***** 



605 610 615 620 625 630 635 640 645 650 655 660 
:::::::::::: 

a ) EWDREINNYTSLIHSLIEESQNQQEKNEQELLELDKWASLWNWFNITNWLWYIKIFIMIV 

b ) QWEREIDNYTSLIYSLLEKSQTQQEKNEQELLELDKWASLWNWFDITNWLWYIKIFIMIV 

c ) EWEREIDNYTGLIYSLIEESQTQQEKNEKELLELDKWASLWNWFSITQWLWYIKIFIMI I 

d ) QWEREIDNYTGIIYNLLEESQNQQEKNEQELLELDKWANLWNWFDITQWLWYIRIFIMIV 

e ) EWEREIDNYTSLIYTLIEESQNQQEKNEQELLELDKWASLWNWFNITNWLWYIKIFIMIV 

f ) QWEREIDNYTNTIYTLLEESQNQQEKNEQELLELDKWASLWNWFSITNWLWYIKIFIMIV 
.*.***.***, *..*.*.**.******. ********* # ***** > ** # ********** > 
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Figure 1 (suite/ 



665 670 675 680 685 690 695 700 705 710 715 720 
' '• :::::::: : 

a ) GGLVGLRIVFAVLSIVNRVRQGYSPLSFQTHLPTPRGPDRPEGIEEEGGERDRDRSIRLV 

b ) GGLVGLRIVFAVLSIVNRVRQGYSPLSLQTRPPVPRGPDRPEGIEEEGGERDRDTSGRLV 

c ) GGLIGLRIVFAVLSLVNRVRQGYSPLSFQTLLPAPRGPDRPEGTEEEGGERGRDRSVRLL 

d ) GGLVGLKIVFAVLSIVNRVRQGYSPLSFQTHLPAPRGPDRPEGIEGEGGERDRDRSGGAV 

e ) GGLVGLRIVFTVLSIVNRVRQGYSPLSFQTRLPSQRGPDRPEGIEEEGGERDRDRSGRLV 

f ) GGLVGLRIVFAVLSIVNRVRQGYSPLSFQTRLPVPRGPDRPDGIEEEGGERDRDRSVRLV 
***.**.***.***.************.** * .******* * ***** ** * 

• • • • • 



725 730 735 740 745 750 755 760 765 770 775 780 
s :::::::::: : 

a ) NGSLALIWDDLRSLCLFS YHRLRDLLLIVTRIVELLGRRGWEALKYWWNLLQYWSQELKN 

b ) HGFLAIIWVDLRSLFLFSYHH-RDLLLIAARIVELLGRRGWEVLKYWWNLLQYWSQELKS 
C ) NGFSALIWDDLRSLCLFS YHRLRDLILIAVRIVELLGRRGWDILKYLWNLLQYWSQELRN 

d ) NGFLTLIWDDLWTLCSFSYHRLRDLLLIWRIVELLGRRGWEALKYWWNLLQYWSQELKN 

e ) DGFLAIIWVD-RSLCLFSYHRLRDLLLIVTRIVELLGRRGWEALKYWWNLLQYWSQELRN 

f ) DGFLALIWEDLRSLCLFSYRRLRDLLLIAARTVEILGHRGWEALKYWWSLLQYWIQELKN 
.* ..** *...* ***..,.***.**..*.**.**.***. *★* *.***** ***.. 



785 790 795 800 805 810 815 820 825 830 
5 * ! s : : : : : : 

a ) SAVSLLNATAIAVAEGTDRVIEWQGACRAIRHIPRRIRQGLERILL • 

b ) SAVSLLNATAIAVAEGTDRVIEVLQRAGRAILHIPTRIRQGLERALL 

c ) SASSLFDAIAIAVAEGTDRVIEIIQRACRAVLNIPRRIRQGLERSLLNGWQMVKKYSGMA 

d ) SAVSLLNTTAIAVAEGTDRI IE VAQRILRAFLHIPRRIRQGLERALL 

e ) SAVSFVNATAIAVAEGTDRVIELLQRAFRAILHIPTRIRQGLERALQ 

f ) SAVSWLNATAIAVTEGTDRVIEVAQRAYRAILHIHRRIRQGLERLLL 

** * ...****.*****.**. * ** ******** * 



a) 

b) 

c ) CYKGKN 

d) 

e) 
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Figure 2 

-30 -25 -20 -15 -10 -5 1 5 10 15 20 25 

: : : : : ::::::: 

a ) MRVKEK YQHL WRWGWKWGTMLLG I — LMICS ATEKL WVTVYYGVPVWKEATTTLFC AS DA 

b ) MM NQLLI AILLASACLVYC — TQ--YVTVFYGVPTWKNATIPLFCATRN 

*. • •* *. * *. # 

30 35 40 45 50 55 60 65 70 75 80 85 
:::::::::::: 

a ) KAYDTEVHNVWATHACVPTDPNPQE WLVNVTENFNMWKNDMVEQMHEDI ISLWDQSLKP 

b ) R DTWGTIQCLPDNDDYQEITL-NVTEAFDAWNNTVTEQAIEDVWHLFETS IKP 

..*.* .*.*.. . **..* *★**.*. *.* ★ * **. 

90 95 100 105 110 115 120 125 
::::::: : 

a ) CVKLTPLCVSLKCTDLGNATNTNSSNTNSSSGEMM MEK 

b) CVKLTPLCVAMKCSSTESSTGNNTTSKSTSTTTTTPTDQEQEISEDTPCARADNCSGLGE 
*'***.*****..-.'**;"; .... 

130 135 140 145 150 155 160 165 170 175 180 

• • : : : : : : : : : 

a) GEIKNCSFNISTSIRGKVQKEYA-FFYKLDIIPIDNDTTSYT LTSCNTSVITQACPK 

b) EETINCQFNMTGLERDK-KKQYNETWYSKDWCETNNSTNQTQCYMNHCNTSVITESCDK 

185 190 195 200 205 210 215 220 225 230 235 240 

• • • * i t : : : : * * 

a) VSFEPIPIHYCAPAGFAILKCNNKTFNGTGP-CTNVSTVQCTHGIRPVVSTQLLLNGSLA 

b) HYWDAIRFRYCAPPGYALLRCNDTNYSGFAPNCSKWASTCTRMMETQTSTWFGFNGTRA 

...*...****.*.*.*.** * .* . **. . . .** . .**. ★ 

245 250 255 260 265 270 275 280 285 290 295 

• ••55 55** •• 

a) EEEWIRSANFTDNAKTIIVQLNQ— SVEINCTRPNNNTRKSIRIQRGPG — RAFVTIGK 

b) ENRTYI YWHGRDNRTIISLNKYYNLSLHCKRPGNKTVKQIMLMSGHVFHSHYQPINK 

*• • * *. ** *.**.*.* * *.. .* 

300 305 310 315 320 325 330 335 340 345 350 

2 5 5 5 5 5 5 5 5 5 Z 

a) IGNMRQAHCNISRAKWNATLKQIASKL— REQF GNNKT 1 1 FKQS S -GG DP E I VTH S FN 

b) — RPRQAWCWF-KGKWKDAMQEVKETLAKHPRYRGTNDTRNISFAAPGKGSDPEVAYMWTN 

• *** * . ..** * * * ... *.**+.. 

* 
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Figure 2 (suite) 



355 360 365 370 375 380 385 390 395 400 405 410 
* ' ::::::::: : 

a ) CGGEFFYCNSTQLFNSTWFNSTWSTEGSNNTEGSDTITLPCRIKQFINMWQEVGKAMYAPP 

b ) CRGEFLYCNMT > — WFLN-WIENKTHRNYA PCHIKQIINTWHKVGRNVYLPP 

* ***.*** * ** , * **.*♦*.** *..**...* ** 

415 420 425 430 435 440 445 450 455 460 465 470 
'• : ::::::::: : 

a ) ISGQIRCSSNITGLLLTRDGGNNNNGSEIFRPGGGDMRDNWRSELYKYKWKIEPLGVAPT 

b ) REGELSCNSTVTSIIANMDWQNNNQTNITFSAEVAEL YRLELGDYKLVEITPIGFAPT 

.*...*.*..* * ***... .* * ** ****** *** 



475 480 485 490 495 500 505 510 515 520 525 530 
• • • " :::::::: 

a ) KAKRRWQREKRAVGIGAL-FLGFLGAAGSTMGARSMTLTVQARQLLSGIVQQQNNLLRAI 

b ) KEKRYSSAHGRHTRGVFVLGFLGFLATAGSAMGAASLTVSAQSRTLLAGIVQQQQQLLDW 

*•.**••• '.♦...•."./ *. .* *****..★**.*★* *.*...*.* *★.*****♦..** 

535 540 545 550 555 560 565 570 575 580 585 590 595 
: : : : : : : : : : : : 

a ) EAQQHLLQLTVWGIKQLQARILAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNKSLEQ 

b ) KRQQELLRLTVWGTKNLQARVTAIEKYLQDQARLNSWGCAFRQVCHTTVPW VNDSLAP 

. **.**. *****^*.**** # *.*.**.**. *. ***. . .* *.**♦ - 



* ** 



600 605 610 615 620 625 630 635 640 645 650 655 

a ) IWNNMTWMEWDREINNYTSLIHSLIEESQNQQEKNEQELLELDKWASLWNWFNITNWLWYIK 

b ) DWDNMTWQEWEKQVRYLEANISKSLEQAQIQQEKNMYELQKLNSWDIFGNWFDLTSWVKYIQ 

*.**** ** * . .*..* ***** ** .*..*. . ***..*.*. **. 

660 665 670 675 680 685 690 695 700 705 710 

- • s : : : : : : : : 

a ) IFIMIVGGLVGLRIVFAVLS IVNRVRQGYSPL SF — QTHLPTPRGPDRPEGIEEEGG 

b ) YGVLIIVAVIALRIVIYWQMLSRLRKGYRPVFSSPPGYIQQIHIHKDRGQPANEETEEDGG 



715 720 725 730 735 740 745 750 755 760 765 
: : : : : : : : : : : 

a ) ERDRDR-SIRLVNGSLALIWDDLRSLC-LFSYHR— LRDLLLIVTRIVELLGRRGWEALK 

b) SNGGDRYWPWPIAYIHFLIRQLIRLLTRLYSICRDLLSRSFLTLQLIYQNL— RDW--LR 
... ** . .. **.. . * * *.* * *. .*.. * . * * * * 
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Figure 2 (suite 1 ) 



770 775 780 785 790 795 800 805 810 815 820 825 

• J i : : : : : : : : : 

a ) YWWNLLQY WSQELKNSAVSLLNATAIAVAEGTDRVIEWQGACRAIRHIPRRIRQG 

b ) LRTAFLQYGCEWIQEAFQAAARATRETLAGACRGLWRVLERIG RGILAVPRRIRQG 

* * <* + * ^> J. -i- . 



,*** * ** ..*.. ..* .. * **.* . * * ******* 



830 

a) LERILL 

b) AEIALL 
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Figure 3 



Pstl 

CTGCAGTGACAATGAGAGTGAAGGAGAAATATCAGCACTTGTGGAGATGGGGG 5 3 
MetArgValLysGluLysTyrGlnHisLeuTrpArgTrpGly 

TGGAAATGGGGCACCATGCTCCTTGGGATATTGATGATCTGTAGTGCTACA 104 
TrpLysTrpGlyThrMetLeuLeuGlylleLeuMetlleCysSerAlaThr 

Kpnl 

GAAAAATTGTGGGTC AC AGTCTATTATGGGGTACCTGTGTGGAAGGAAGCA 155 
GluLysLeuTrpValThrValTyrTyrGlyValProValTrpLysGluAla 

ACC ACC ACTCTATTTTGTGCATCAGATGCTAAAGCATATGATACAGAGGTA 206 
ThrThrThrLeuPheCysAlaSerAspAlaLysAlaTyrAspThrGluVal 

CATAATGTTTGGGCCACACATGCCTGTGTACCCACAGACCCCAACCCACAA 257 
HisAsnValTrpAlaThrHisAlaCysValProThrAspProAsnProGln 

GAAGTAGTATTGGTAAATGTGACAGAAAATTTTAACATGTGGAAAAATGAC 308 
GluValValLeuValAsnValThrGluAsnPheAsnMetTrpLysAsnAsp 

ATGGTAGAACAGATGCATGAGGATATAATCAGTTTATGGGATCAAAGCCTA 359 
MetValGluGlnMetHisGluAspIlelleSerLeuTrpAspGlriSerLeu 

AAGCCATGTGTAAAATTAACCCCACTCTGTGTTAGTTTAAAGTGCACTGAT 410 
LysProCysValLysLeuThrProLeuCysValSerLeuLysCysThrAsp 

TTGGGGAATGCTACTAATACCAATAGTAGTAATACCAATAGTAGTAGCGGG 461 
LeuGlyAsnAlaThrAsnThrAsnSerSerAsnThrAsnSerSerSerGly 

GAAATGATGATGGAGAAAGGAGAGATAAAAAACTGCTCTTTCAATATCAGC 512 
GluMetMetMetGluLysGlyGluIleLysAsnCysSerPheAsnlleSer 

ACAAGCATAAGAGGTAAGGTGCAGAAAGAATATGC ATTTTTTTATAAACTT 563 
ThrSerlleArgGlyLysValGlnLysGluTyrAlaPhePheTyrLysLeu 

GATATAATACCAATAGATAATGATACTACCAGCTATACGTTGACAAGTTGT 614 
AspIlelleProIleAspAsnAspThrThrSerTyrThrLeuThrSerCys 

AACACCTCAGTCATTACACAGGCCTGTCCAAAGGTATCCTTTGAGCCAATT 665 
AsnThrSerVallleThrGlnAlaCysProLysValSerPheGluProlle 

CCCATACATTATTGTGCCCCGGCTGGTTTTGCGATTCTAAAATGTAATAAT 716 
ProIleHisTyrCysAlaProAlaGlyPheAlalleLeuLysCysAsnAsn 

AAGACGTTCAATGGAACAGGACCATGTACAAATGTCAGCACAGTACAATGT 767 
LysThrPheAsnGlyThrGlyProCysThrAsnValSerThrValGlnCys 

ACACATGGAATTAGGCCAGTAGTATCAACTCAACTGCTGTTGAATGGCAGT 818 
ThrHisGlylleArgProValValSerThrGlnLeuLeuLeuAsnGlySer 

CTAGCAGAAGAAGAGGTAGTAATTAGATCTGCCAATTTCACAGACAATGCT 869 
LeuAlaGluGluGluValVallleArgSerAlaAsnPheThrAspAsnAla 
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Figure 3 , (guitft) 



AAAACCATAATAGTACAGCTGAACC AATCTGTAGAAATTAATTGTAC AAGA 920 
LysThrllelleValGlnLeuAsnGlnSerValGluIleAsnCysThrArg 

CCCAACAACAATACAAGAAAAAGTATCCGTATCCAGAGGGGACC AGGGAGA 971 
ProAsnAsnAsnThrArgLysSerlleArglleGlnArgGlyProGlyArg 

GCATTTGTTACAATAGGAAAAATAGGAAATATGAGACAAGCACATTGTAAC 1022 
AlaPheValThrlleGlyLysIleGlyAsnMetArgGlnAlaHisCysAsn 

ATTAGTAGAGCAAAATGGAATGCCACTTTAAAACAGATAGCTAGCAAATTA 1073 
IleSerArgAlaLysTrpAsnAlaThrLeuLysGlnlleAlaSerLysLeu 

AGAGAACAATTTGGAAATAATAAAACAATAATCTTTAAGCAATCCTCAGGA 1124 
ArgGluGlnPheGlyAsnAsnLysThrllellePheLysGlnSerSerGly 

GGGGACCCAGAAATTGTAACGCACAGTTTTAATTGTGGAGGGGAATTTTTC 1175 
GlyAspProGluIleValThrHisSerPheAsnCysGlyGlyGluPhePhe 

TACTGTAATTCAACACAACTGTTTAATAGTACTTGGTTTAATAGTACTTGG 1226 
TyrCysAsnSerThrGlnLeuPheAsnSerThrTrpPheAsnSerThrTrp 

AGTACTGAAGGGTCAAATAACACTGAAGGAAGTGAC ACAATCACACTCCCA 1277 
SerThrGluGlySerAsnAsnThrGluGlySerAspThrlleThrLeuPro 

TGCAGAATAAAACAATTTATAAACATGTGGCAGGAAGTAGGAAAAGCAATG 1328 
CysArglleLysGlnPhelleAsnMetTrpGlnGluValGlyLysAlaMet 

TATGCCCCTCCCATCAGCGGACAAATTAGATGTTCATCAAATATTACAGGG 1379 
TyrAlaProProIleSerGlyGlnlleArgCysSerSerAsnlleThrGly 

Bglll 

CTGCTATTAAC AAGAGATGGTGGTAATAACAACAATGGGTCCGAGATCTTC 1430 
LeuLeuLeuThrArgAspGlyGlyAsnAsnAsnAsnGlySerGluIlePhe 

AGACCTGGAGGAGGAGATATGAGGGACAATTGGAGAAGTGAATTATATAAA 14 81 
ArgProGlyGlyGlyAspMetArgAspAsnTrpArgSerGluLeuTyrLys 

TATAAAGTAGTAAAAATTGAACCATTAGGAGTAGCACCCACCAAGGCACAG 1532 
TyrLysValValLysIleGluProLeuGlyValAlaProThrLysAlaGln 

AATCACGTGGTGCAGAATGAACACCAAGCAGTGGGAATAGGAGCTTTGTTC 1583 
AsnHisValValGlnAsnGluHisGlnAlaValGlylleGlyAlaLeuPhe 

CTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCACGGTCAATGACG 1634 
LeuGlyPheLeuGlyAlaAlaGlySerThrMetGlyAlaArgSerMetThr 

CTGACGGTACAGGCCAGAC AATTATTGTCTGGTATAGTGCAGC AGC AGAAC 1685 
LeuThrValGlnAlcLArgGlnLeuLeuSerGlylleValGlnGlnGlnAsn 

AATTTGCTGAGGGCTATTGAGGCGCAACAGCATCTGTTGCAACTCACAGTC 1736 
AsnLeuLeuArgAlalleGluAlaGlnGlnHisLeuLeuGlnLeuThrVal 
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Figure 3 (suited 



TGGGGCATCAAGCAGCTCCAGGCAAGAATCCTGGCTGTGGAAAGATACCTA 1787 
TrpGlylleLysGlnLeuGlnAlaArglleLeuAlaValGluArgTyrLeu 

AAGGATCAACAGCTCCTGGGGATTTGGGGTTGCTCTGGAAAACTCATTTGC 1838 
LysAspGlnGlnLeuLeuGlylleTrpGlyCysSerGlyLysLeuIleCys 

ACCACTGCTGTGCCTTGGAATGCTAGTTGGAGTAATAAATCTCTGGAACAG 1889 
ThrThrAlaValProTrpAsnAlaSerTrpSerAsnLysSerLeuGluGln 

ATTTGGAATAACATGACCTGGATGGAGTGGGAC AGAGAAATTAAC AATTAC 1940 
IleTrpAsnAsnMetThrTrpMetGluTrpAspArgGluIleAsnAsnTyr 

ACAAGCTTAATACATTCCTTAATTGAAGAATCGCAAAACCAGCAAGAAAAG 1991 
ThrSerLeuIleHisSerLeuIleGluGluSerGlnAsnGlnGlnGluLys 

AATGAAC AAGAATTATTGGAATTAGATAAATGGGC AAGTTTGTGGAATTGG 2042 
AsnGluGlnGluLeuLeuGluLeuAspLysTrpAlaSerLeuTrpAsnTrp 

TTTAACATAACAAATTGGCTGTGGTATATAAAAAATAGAGTTAGGCAGGGA 2093 
PheAsnlleThrAsnTrpLeuTrpTyrlleLysAsnArgValArgGlnGly 

TATTCACCATTATCGTTTCAGACCCACCTCCCAACCCCGAGGGGACCCGAC 2144 
TyrSerProLeuSerPheGlnThrHisLeuProThrProArgGlyProAsp 



AGGCCCGAAGGAATAGAAGAAGAAGGTGGAGAGAGAGACAGAGACAGATCC 2195 
ArgProGluGlylleGluGluGluGlyGlyGluArgAspArgAspArgSer 

ATTCGATTAGTGAACGGATCCTTAGCACTTATCTGGGACGATCTGCGGAGC 224 6 
IleArgLeuValAsnGlySerLeuAlaLeuIleTrpAspAspLeuArgSer 

CTGTGCCTCTTCAGCTACCACCGCTTGAGAGACTTACTCTTGATTGTAACG 2297 
LeuCysLeuPheSerTyrHisArgLeuArgAspLeuLeuLeuIleValThr 

AGGATTGTGGAACTTCTGGGACGCAGGGGGTGGGAAGCCCTCAAATATTGG 2348 
ArglleValGluLeuLeuGlyArgArgGlyTrpGluAlaLeuLysTyrTrp 

TGGAATCTCCTACAGTATTGGAGTCAGGAACTAAAGAATAGTGCTGTTAGC 23 99 
TrpAsnLeuLeuGlnTyrTrpSerGlnGluLeuLysAsnSerAlaValSer 

TTGCTCAATGCCACAGCCATAGCAGTAGCTGAGGGGACAGATAGGGTTATA 2450 
LeuLeuAsnAlaThrAlalleAlaValAlaGluGlyThrAspArgVallle 

GAAGTAGTACAAGGAGCTTGTAGAGCTATTCGCCACATACCTAGAAGAATA 2501 
GluValValGlnGlyAlaCysArgAlalleArgHisIleProArgArglle 

AGACAGGGCTTGGAAAGGATTTTGCTATAAGATGGGTGGC AAGTGGTCAAA 2552 
ArgGlnGlyLeuGluArglleLeuLeuTerAspGlyTrpGlnValValLys 
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Figure 3 (suite) 



AAGTAGTGTGGTTGGATGGCCTACTGTAAGGGAAAGAATGAGACGAGCTGA 2603 
LysTerCysGlyTrpMetAlaTyrCysLysGlyLysAsnGluThrSer*** 

PstI 

GCCAGCAGC AGATGGGGTGGGAGCAGCATCTCGACCTGCAG 2644 
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Figure 5 



GGC 

ATGAGAGTGAAGGGGATCAGGAGGAATTATCAGCACTGGTGGGGATGGGGC 51 
Me t Ar gValLy s Gly I leAr g Ar gAs nTy r Gl n H i sTr pTr pGly TrpGly 

OTG2624 

AGCATGCTCCTTGGGATATTGATGATCTG 

ACGATGCTCCTTGGGTTATTAATGATCTGTAGTGCTACAGAAAAATTGTGG 102 
ThrMetLeuLeuGlyLeuLeuMetlleCysSerAlaThrGluLysLeuTrp 

GTC AC AGTCTATTATGGGGTACCTGTGTGGAAAGAAGC AACCACCACTCTA 153 
ValThrValTyrTyrGlyValProValTrpLysGluAlaThrThrThrLeu 

TTTTGTGC ATC AGATGCTAAAGC ATATGATAC AGAGGTAC ATAATGTTTGG 204 
PheCysAlaSerAspAlaLysAlaTyrAspThrGluValHisAsnValTrp 

GCCACACAAGCCTGTGTACCCACAGACCCCAACCCACAAGAAGTAGAATTG 255 
AlaThrGlnAlaCysValProThrAspProAsnProGlnGluValGluLeu 

GTAAATGTGACAGAAAATTTTAACATGTGGAAAAATAAC ATGGTAGAACAG 306 
ValAsnValThrGluAsnPheAsnMetTrpLysAsnAsnMetValGluGln 

ATGC ATGAGGATATAATC AGTTTATGGGATCAAAGCCTAAAGCC ATGTGTA 357 
MetHisGluAspIlelleSerLeuTrpAspGlnSerLeuLysProCysVal 

AAATTAACCCCACTCTGTGTTACTTTAAATTGCACTGATTTGAGGAATACT 408 
LysLeuThrProLeuCysValThrLeuAsnCysThrAspLeuArgAsnThr 

ACTAATACCAATAATAGTACTGCTAATAACAATAGTAATAGCGAGGGAACA 459 
Thr As nThr As nAs nSerThr Al aAs nAs nAs nS er As nSer GluGly Thr 

ATAAAGGGAGGAGAAATGAAAAACTGCTCTTTCAATATCACCACAAGCATA 510 
IleLysGlyGlyGluMetLysAsnCysSerPheAsnlleThrThrSerlle 

AGAGATAAGATGCAGAAAGAATATGC ACTTCTTTATAAACTTGATATAGTA 561 
ArgAspLysMetGlnLysGluTyrAlaLeuLeuTyrLysLeuAspIleVal 

TCAATAGATAATGATAGTACCAGCTATAGGTTGATAAGTTGTAATACCTC A 612 
SerlleAspAsnAspSerThrSerTyrArgLeuIleSerCysAsnThrSer 

GTCATTACACAAGCTTGTCCAAAGATATCCTTTGAGCCAATTCCCATACAC 663 
Val I leThrGlnAlaCy s ProLy s I leSerPheGluProI leProI leHis 

TATTGTGCCCCGGCTGGTTTTGCGATTCTAAAATGTAACGATAAAAAGTTC 714 
TyrCysAlaProAlaGlyPheAlalleLeuLysCysAsnAspLysLysPhe 

AGTGGAAAAGGATC ATGTAAAAATGTC AGCACAGTAC AATGTAC AC ATGGA 765 
SerGlyLysGlySerCysLysAsnValSerThrValGlnCysThrHisGly 

ATTAGGCCAGTAGTATCAACTCAACTGCTGTTAAATGGCAGTCTAGC AGAA 816 
IleArgProValValSerThrGlnLeuLeuLeuAsnGlySerLeuAlaGlu 
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Figure 5 (suite) 



GAAGAGGTAGTAATTAGATCTGAGAATTTCACTGATAATGCTAAAACC ATC 867 
GluGluValVallleArgSerGluAsnPheThrAspAsnAlaLysThrlle 

ATAGTACATCTGAATGAATCTGTACAAATTAATTGTACAAGACCC AACTAC 918 
IleValHisLeuAsnGluSerValGlnlleAsnCysThrArgProAsnTyr 

AATAAAAGAAAAAGGATACATATAGGACCAGGGAGAGCATTTTATAC AACA 969 
AsnLysArgLysArglleHisIleGlyProGlyArgAlaPheTyrThrThr 

AAAAATATAATAGGAACTATAAGACAAGCACATTGTAACATTAGTAGAGCA 1020 
LysAsnllelleGlyThrlleArgGlnAlaHisCysAsnlleSerArgAla 

AAATGGAATGACACTTTAAGACAGATAGTTAGCAAATTAAAAGAACAATTT 1071 
LysTrpAsnAspThrLeuArgGlnlleValSerLysLeuLysGluGlnPhe 

AAGAATAAAACAATAGTCTTTAATCAATCCTCAGGAGGGGACCCAGAAATT 1 1 22 
LysAsnLysThrlleValPheAsnGlnSerSerGlyGlyAspProGluIle 

GTAATGCACAGTTTTAATTGTGGAGGGGAATTTTTCTACTGTAATACATCA 1 17 3 
ValMetHisSerPheAsnCysGlyGlyGluPhePheTyrCysAsnThrSer 

CC ACTGTTTAATAGTACTTGGAATGGTAATAATACTTGGAATAATACTACA 1224 
Pr oLeuPheAs nSer Thr TrpAs nGlyAs nAs nThrTrpAs nAs nThrThr 

GGGTCAAATAACAATATCACACTTCAATGCAAAATAAAACAAATTATAAAC 1275 
GlySerAsnAsnAsnlleThrLeuGlnCysLysIleLysGlnllelleAsn 

ATGTGGCAGGAAGTAGGAAAAGCAATGTATGCCCCTCCCATTGAAGGACAA 1326 
MetTrpGlnGluValGlyLysAlaMetTyrAlaProProIleGluGlyGln 

ATTAGATGTTCATCAAATATTACAGGGCTACTATTAACAAGAGATGGTGGT 1377 
IleArgCysSerSerAsnlleThrGlyLeuLeuLeuThrArgAspGlyGly 

AAGGACACGGACACGAACGACACCGAGATCTTCAGACCTGGAGGAGGAGAT 1428 
LysAspThrAspThrAsnAspThrGluIlePheArgProGlyGlyGlyAsp 

ATGAGGGACAATTGGAGAAGTGAATTATATAAATATAAAGTAGTAAC AATT 1479 
MetArgAspAsnTrpArgSerGluLeuTyrLysTyrLysValValThrlle 

OTG2625 

CTTGGTAATCCTCATCGTGGGTGGGCCCGTTTC 

GAACCATTAGGAGTAGCACCCACCAAGGCAAAGAGAAGAGTGGTGCAGAGA 1530 
GluProLeuGlyValAlaProThrLysAlaLysArgArgValValGlnArg 

GAAAAAAGA 1539 
GluLysArg 
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Figure 6 



GGC 

ATGAGAGCGAGGGGGATAGAGAGAAATTGTCAAAACTGGTGGAAATGGGGC 5 1 
MetArgAlaArgGlylleGluArgAsnCysGlnAsnTrpTrpLysTrpGly 

OTG2624 

AGCATGCTCCTTGGGATATTGATGATCTG 

ATC ATGCTCCTTGGGATATTGATGACCTGTAGTGCTGCAGACAATCTGTGG 102 
IleMetLeuLeuGlylleLeuMetThrCysSerAlaAlaAspAsnLeuTrp 

GTCACAGTTTATTATGGGGTGCCTGTATGGAAGGAAGCAACCACCACTCTA 153 
ValThrValTyrTyrGlyValProValTrpLysGluAlaThrThrThrLeu 

TTTTGTGCATCAGATGCTAAATCATATGAAACAGAGGCACATAATATCTGG 204 
PheCysAlaSerAspAlaLysSerTyrGluThrGluAlaHisAsnlleTrp 

GCC ACACATGCCTGTGTACCCACGGACCCC AACCCAC AAGAAATAGCACTG 255 
AlaThrHisAlaCysValProThrAspProAsnProGlnGluIleAlaLeu 

GAAAATGTGACAGAAAACTTTAACATGTGGAAAAATAACATGGTGGAACAG 306 
GluAsnValThrGluAsnPheAsnMetTrpLysAsnAsnMetValGluGln 

ATGCATGAGGATATAATC AGTTTATGGGATCAAAGCCTAAAACCATGTGTA 357 
MetHisGluAspIlelleSerLeuTrpAspGlnSerLeuLysProCysVal 

AAATTAACCCCACTCTGTGTCACTTTAAACTGTAGTGATGAATTGAGGAAC 408 
LysLeuThrProLeuCysValThrLeuAsnCysSerAspGluLeuArgAsn 

AATGGCACTATGGGGAACAATGTCACTACAGAGGAGAAAGGAATGAAAAAC 459 
As nGly ThrMe tGlyAs nAs nValThrThr GluGluLy s GlyMe t Ly s As n 

TGCTCTTTCAATGTAACCACAGTACTAAAAGATAAGAAGCAGCAAGTATAT 510 
CysSerPheAsnValThrThrValLeuLysAspLysLysGlnGlnValTyr 

GCACTTTTTTATAGACTTGATATAGTACCAATAGACAATGATAGTAGTACC 561 
AlaLeuPheTyrArgLeuAspIleValProIleAspAsnAspSerSerThr 

AATAGTACCAATTATAGGTTAATAAATTGTAATACCTCAGCCATTAC ACAG 612 
AsnSerThrAsnTyrArgLeuIleAsnCysAsnThrSerAlalleThrGln 

GCTTGTCCAAAGGTATCCTTTGAGCCAATTCCCATAC ATTATTGTGCCCCA 663 
AlaCysProLysValSerPheGluProIleProIleHisTyrCysAlaPro 

GCTGGTTTTGCGATTCTAAAGTGTAGAGATAAGAAGTTCAATGGAACAGGC 714 
AlaGlyPheAlalleLeuLysCysArgAspLysLysPheAsnGlyThrGly 

CCATGCACAAATGTCAGCACAGTACAATGTACACATGGAATTAGGCCAGTG 765 
ProCysThrAsnValSerThrValGlnCysThrHisGlylleArgProVal 

GTGTCAACTCAACTGCTGTTGAATGGCAGTCTAGCAGAAGAAGAGGTCATA 816 
ValSerThrGlnLeuLeuLeuAsnGlySerLeuAlaGluGluGluVallle 
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Figure 6 (suited 



ATTAGATCCGAAAATCTCAC AAACAATGCTAAAAAC ATAATAGCACATCTT 867 
IleArgSerGluAsnLeuThrAsnAsnAlaLysAsnllelleAlaHisLeu 

AATGAATCTGTAAAAATTACCTGTGCAAGGCCCTATCAAAATACAAGACAA 918 
AsnGluSerValLysIleThrCysAlaArgProTyrGlnAsnThrArgGln 

AGAACACCTATAGGACTAGGGCAATCACTCTATACTACAAGATCAAGATCA 969 
ArgThrProIleGlyLeuGlyGlnSerLeuTyrThrThrArgSerArgSer 

ATAATAGGAC AAGC AC ATTGTAATATTAGTAGAGCAC AATGGAGTAAAACT 1020 
IlelleGlyGlnAlaHisCysAsnlleSerArgAlaGlnTrpSerLysThr 

TTACAACAAGTAGCTAGAAAATTAGGAACCCTTCTTAAC AAAAC AATAATA 1071 
LeuGlnGlnValAlaArgLysLeuGlyThrLeuLeuAsnLysThrllelle 

AAGTTTAAACCATCCTCAGGAGGGGACCCAGAAATTACAACACACAGTTTT 1122 
LysPheLysProSerSerGlyGlyAspProGluIleThrThrHisSerPhe 

AATTGTGGAGGGGAATTCTTCTACTGTAATAC ATCAGGACTGTTTAATAGT 1173 
AsnCysGlyGlyGluPhePheTyrCysAsnThrSerGlyLeuPheAsnSer 

ACATGGAATATTAGTGC ATGGAATAATATTACAGAGTCAAATAATAGC ACA 1224 
ThrTrpAsnlleSerAlaTrpAsnAsnlleThrGluSerAsnAsnSerThr 

AAC AC AAAC ATC AC ACTCCAATGCAGAATAAAAC AAATTATAAAGATGGTG 12 75 
AsnThrAsnlleThrLeuGlnCysArglleLysGlnllelleLysMetVal 

GCAGGCAGGAAAGCAATATATGCCCCTCCTATCGAAAGAAACATTCTATGT 1326 
AlaGlyArgLysAlalleTyrAlaProProIleGluArgAsnlleLeuCys 

TCATCAAATATTACAGGGCTACTATTGACAAGAGATGGTGGTATAAATAAT 1377 
SerSerAsnlleThrGlyLeuLeuLeuThrArgAspGlyGlylleAsnAsn 

AGTACTAACGAGACCTTTAGACCTGGAGGAGGAGATATGAGGGACAATTGG 1428 
SerThrAsnGluThrPheArgProGlyGlyGlyAspMetArgAspAsnTrp 

CTTGGTAATCCTCAT 
AGAAGTGAATTATATAAATATAAGGTAGTACAAATTGAACCACTAGGAGTA 147 9 
ArgSerGluLeuTyrLysTyrLysValValGlnlleGluProLeuGlyVal 

OTG2625 

CGTGGGTGGGCCCGTTTC 

GCACCCACCAGGGCAAAGAGAAGAGTGGTGGAAAGAGAAAAAAGA 1524 
AlaProThrArgAlaLysArgArgValValGluArgGluLysArg 
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Figure 7 



GGC 

ATGAGAGTGATGGAGATGAGGAAGAATTGTCAGCACTTGTGGAAATGGGGC 5 1 
MetArgValMetGluMetArgLysAsnCysGlnHisLeuTrpLysTrpGly 

OTG2624 

AGCATGCTCCTTGGGATATTGATGATCTG 

ACCATGCTCCTTGGGATGTTGATGATCTGTAGTGCTGCAGAGGACTTGTGG 102 
ThrMetLeuLeuGlyMetLeuMetlleCysSerAlaAlaGluAspLeuTrp 

GTCAC AGTCTATTATGGGGTACCTGTGTGGAAAGAAGC AACCACC ACTCTA 153 
ValThrValTyrTyrGlyValProValTrpLysGluAlaThrThrThrLeu 

TTTTGTGCATC AGAAGCTAAAGC ATATAAAACAGAGGTACATAATGTCTGG 204 
PheCysAlaSerGluAlaLysAlaTyrLysThrGluValHisAsnValTrp 

GCCAAACATGCTTGTGTACCTACAGACCCCAACCCACAAGAAGTACTATTG 255 
AlaLysHisAlaCysValProThrAspProAsnProGlnGluValLeuLeu 

GAAAATGTGAC AGAAAATTTTAACATGTGGAAAAATAACATGGTAGAAC AG 306 
GluAsnValThrGluAsnPheAsnMetTrpLysAsnAsnMetValGluGln 

ATGC ATGAGGATATAATC AGTTTATGGGATCAAAGCCTAAAGCC ATGTGTA 357 
MetHisGluAspIlelleSerLeuTrpAspGlnSerLeuLysProCysVal 

AAATTAACCCCACTCTGTGTTACTTTAAATTGCACTGATGCTAACTTG21AT 408 
LysLeuThrProLeuCysValThrLeuAsnCysThrAspAlaAsnLeuAsn 

GGTACTAATGTCACTAGTAGTAGCGGGGGAACAATGATGGAGAACGGAGAA 459 
GlyThrAsnValThrSerSerSerGlyGlyThrMetMetGluAsnGlyGlu 

ATAAAAAACTGCTCTTTCCAAGTTACCACAAGTAGAAGAGATAAGACGCAG 510 
IleLysAsnCysSerPheGlnValThrThrSerArgArgAspLysThrGln 

AAAAAATATGCACTTTTTTATAAACTTGATGTGGTACCAATAGAGAAGGGT 561 
LysLysTyrAlaLeuPheTyrLysLeuAspValValProIleGluLysGly 

AATATTAGCCCTAAGAATAATACTAGCAATAATACTAGCTATGGTAACTAT 612 
As nl leSerPr oLy s As nAs nThr S er As nAs nThr S e r TyrGlyAs nTy r 

ACATTGATACATTGTAATTCCTCAGTCATTACACAGGCCTGTCCAAAGGTA 663 
ThrLeuIleHisCysAsnSerSerVallleThrGlnAlaCysProLysVal 

TCCTTTGAGCCAATTCCCATACATTATTGCACCCCGGCTGGTTTTGCGATT 714 
SerPheGluProIleProIleHisTyrCysThrProAlaGlyPheAlalle 

CTAAAGTGTAATGATAAGAAGTTCAATGGAAC AGGACC ATGTAAAAATGTC 765 
LeuLysCysAsnAspLysLysPheAsnGlyThrGlyProCysLysAsnVal 

AGCACAGTACAATGTACACATGGAATTAGGCCAGTAGTGTCAACTCAACTG 816 
SerThrValGlnCysThrHisGlylleArgProValValSerThrGlnLeu 
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Figure 7 (suited 



CTGTTAAATGGCAGTCTAGCAGAAGAAGAGGTAGTAATTAGATCTGAAAAT 867 
LeuLeuAs nGlySerLeuAlaGluGluGlu Valval I leAr gSerGluAs n 

TTCACGGACAATGTTAAAACCATAATAGTACAGCTGAATGCATCTGTACAA 918 
PheThrAspAsnValLysThrllelleValGlnLeuAsnAlaSerValGln 

ATTAATTGTACAAGACCCAACAACAATACAAGAAAAAGTATAACTAAGGGA 969 
IleAsnCysThrArgProAsnAsnAsnThrArgLysSerlleThrLysGly 

CCAGGGAGAGTAATTTATGCAACAGGACAAATAATAGGAGATATAAGAAAA 1020 
ProGlyArgVallleTyrAlaThrGlyGlnllelleGlyAspIleArgLys 

GC ACATTGTAACCTTAGTAGAGCAC AATGGAATAACACTTTAAAACAGGTA 1071 
AlaHisCysAsnLeuSerArgAlaGlnTrpAsnAsnThrLeuLysGlnVal 

GTTACAAAATTAAGAGAACAATTTGACAATAAAACAATAGTCTTTACGTCA 1122 
ValThrLysLeuArgGluGlnPheAspAsnLysThrlleValPheThrSer 

TCCTCAGGAGGGGACCCAGAAATTGTACTTCACAGTTTTAATTGTGGAGGG 1173 
SerSerGlyGlyAspProGluIleValLeuHisSerPheAsnCysGlyGly 

GAATTTTTCTACTGTAATACAACAC AACTGTTTAATAGTACTTGGAATAGT 1224 
GluPhePheTyrCysAsnThrThrGlnLeuPheAsnSerThrTrpAsnSer 

ACTGAAGGGTCAAATAACACTGGAGGAAATGACACAATCACACTCCCATGC 1275 
ThrGluGlySerAsnAsnThrGlyGlyAsnAspThrlleThrLeuProCys 

AGAATAAAACAAATTGTAAACATGTGGCAGGAAGTAGGAAAAGCAATGTAT 1326 
ArglleLysGlnlleValAsnMetTrpGlnGluValGlyLysAlaMetTyr 

GCCCCTCCCATCAGTGGACAAATTAAATGTATATCAAATATTACAGGGCTA 1377 
AlaProProIleSerGlyGlnlleLysCysIleSerAsnlleThrGlyLeu 

CTATTAACAAGAGATGGGGGTGAAGATAC AACTAATACTACAGAGATCTTC 1428 
LeuLeuThrArgAspGlyGlyGluAspThrThrAsnThrThrGluIlePhe 

AGACTTGGAGGAGGAAATATGAGGGACAATTGGAGAAGTGAATTATATAAA 1479 
ArgLeuGlyGlyGlyAsnMetArgAspAsnTrpArgSerGluLeuTyrLys 

OTG2625 

CTTGGTAATCCTCATCGTGGGTGGGCCCGTTTG 
TATAAAGTGGTAAGAATTGAGCCATTAGGAGTGGCACCCACTAGGGCAAAG 1530 
TyrLysValValArglleGluProLeuGlyValAlaProThrArgAlaLys 

AGAAGAGTGGTGCAAAGAGAAAAAAGA 1557 
ArgArgValValGlnArgGluLysArg 
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Figure 8 



GGC 

ATGAAAGTGAAGGGGACCAGGAGGAATTATCAGCACTTGTGGAGATGGGGC 5 1 
MetLysValLysGlyThrArgArgAsnTyrGlnHisLeuTrpArgTrpGly 

OTG2624 

AGCATGCTCCTTGGGATATTGATGATCTG 

ACCTTGCTCCTTGGGATGTTGATGATCTGTAGTGCTACAGAAAAATTGTGG 102 
ThrLeuLeuLeuGlyMetLeuMetlleCysSerAlaThrGluLysLeuTrp 

GTCACAGTTTATTATGGAGTACCTGTGTGGAAAGAAGCAACTACCACTCTA 153 
ValThrValTyrTyrGlyValProValTrpLysGluAlaThrThrThrLeu 

TTTTGTGCATCAGATGCTAGAGCATATGATACAGAGGTACATAATGTTTGG 204 
PheCysAlaSerAspAlaArgAlaTyrAspThrGluValHisAsnValTrp 

GCCACACATGCCTGTGTACCCACAGACCCCAACCCACAAGAAGTAGTATTG 255 
AlaThrHisAlaCysValProThrAspProAsnProGlnGluValValLeu 

GGAAATGTGACAGAAAATTTTAACATGTGGAAAAATAACATGGTAGAACAG 306 
GlyAsnValThrGluAsnPheAsnMetTrpLysAsnAsnMetValGluGln 

' ATGCAGGAGGATATAATCAGTTTATGGGATCAAAGCCTAAAGCCATGTGTA 357 
MetGlnGluAspIlelleSerLeuTrpAspGlnSerLeuLysProCysVal 

AAATTAACCCCACTCTGTGTTACTTTAAATTGCACTGATTTGGGGAAGGCT 408 
LysLeuThrProLeuCysValThrLeuAsnCysThrAspLeuGlyLysAla 

ACTAATACCAATAGTAGTAATTGGAAAGAAGAAATAAAAGGAGAAATAAAA 459 
ThrAsnThrAsnSerSerAsnTrpLysGluGluIleLysGlyGluIleLys 

AACTGCTCTTTCAATATCACCACAAGCATAAGAGATAAGATTCAGAAAGAA 510 
AsnCysSerPheAsnlleThrThrSerlleArgAspLysIleGlnLysGlu 

AATGCACTTTTTCGTAACCTTGATGTAGTACCAATAGATAATGCTAGTACT 561 
AsnAlaLeuPheArgAsnLeuAspValValProIleAspAsnAlaSerThr 

ACTACCAACTATACCAACTATAGGTTGATACATTGTAACAGATCAGTCATT 612 
ThrThrAsnTyrThrAsnTyrArgLeuIleHisCysAsnArgSerVallle 

ACACAGGCCTGTCCAAAGGTATCATTTGAGCCAATTCCCATAC ATTATTGT 663 
ThrGlnAlaCysProLysValSerPheGluProIleProIleHisTyrCys 

ACCCCGGCTGGTTTTGCGATTCTAAAGTGTAATAATAAAACGTTCAATGGA 714 
ThrProAlaGlyPheAlalleLeuLysCysAsnAsnLysThrPheAsnGly 

AAAGGACCATGTAC AAATGTCAGCACAGTACAATGTACACATGGAATTAGG 765 
LysGlyProCysThrAsnValSerThrValGlnCysThrHisGlylleArg 

CCAATAGTGTCAACTCAACTGCTGTTAAATGGCAGTCTAGCAGAAGAAGAG 816 
ProIleValSerThrGlnLeuLeuLeuAsnGlySerLeuAlaGluGluGlu 
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GTAGTAATTAGATCTGACAATTTCACGAACAATGCTAAAACCATAATAGTA 867 
ValVallleArgSerAspAsnPheThrAsnAsnAlaLysThrllelleVal 

CAGCTGAATGAATCTGTAGCAATTAACTGTACAAGACCCAACAACAATACA 918 
GlnLeuAsnGluSerValAlalleAsnCysThrArgProAsnAsnAsnThr 

AGAAAAAGTATCTATATAGGACCAGGGAGAGCATTTCATACAACAGGAAGA 969 
ArgLysSerlleTyrlleGlyProGlyArgAlaPheHisThrThrGlyArg 

ATAATAGGAGATATAAGAAAAGCAC ATTGTAACATTAGTAGAGCACAATGG 1020 
IlelleGlyAspIleArgLysAlaHisCysAsnlleSerArgAlaGlnTrp 

AATAACACTTTAGAACAGATAGTTAAAAAATTAAGAGAACAGTTTGGGAAT 1071 
AsnAsnThrLeuGluGlnlleValLysLysLeuArgGluGlnPheGlyAsn 

AATAAAACAATAGTCTTTAATCAATCCTCAGGAGGGGACCCAGAAATTGTA 1122 
AsnLysThrlleValPheAsnGlnSerSerGlyGlyAspProGluIleVal 

ATGCACAGTTTTAATTGTAGAGGGGAATTTTTCTACTGTAATACAACACAA 1173 
MetHisSerPheAsnCysArgGlyGluPhePheTyrCysAsnThrThrGln 

CTGTTTAATAATACATGGAGGTTAAATCACACTGAAGGAACTAAAGGAAAT 1224 
LeuPheAsnAsnThrTrpArgLeuAsnHisThrGluGlyThrLysGlyAsn 

GACACAATCATACTCCCATGTAGAATAAAAC AAATTATAAACATGTGGCAG 1275 
AspThrllelleLeuProCysArglleLysGlnllelleAsnMetTrpGln 

GAAGTAGGAAAAGCAATGTATGCCCCTCCCATTGGAGGACAAATTAGTTGT 1326 
GluValGlyLysAlaMetTyrAlaProProlleGlyGlyGlnlleSerCys 

TCATCAAATATTACAGGGCTGCTATTAAC AAGAGATGGTGGTACAAATGTA 1377 
SerSerAsnlleThrGlyLeuLeuLeuThrArgAspGlyGlyThrAsnVal 

ACTAATGACACCGAGGTCTTCAGACCTGGAGGAGGAGATATGAGGGACAAT 1428 
ThrAsnAspThrGluValPheArgProGlyGlyGlyAspMetArgAspAsn 

CTTGGTAATCCT 

TGGAGAAGTGAATTATATAAATATAAAGTAATAAAAATTGAACCATTAGGA 1479 
TrpArgSerGluLeuTyrLysTyrLysVallleLyslleGluProLeuGly 

OTG2625 
CATCGTGGGTGGGCCCGTTTC 

ATAGCACCCACC AAGGCAAAGAGAAGAGTGGTGCAGAGAGAAAAAAGA 1527 
IleAlaProThrLysAlaLysArgArgValValGlnArgGluLysArg 
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